NVvH Chirurgendagen 2020

ABSTRACT
Categorie: Traumachirurgie

Neurale netwerken spelen vals bij het detecteren van heupfracturen in röntgenfoto’s

M. Nauta1, O.T. Paalvast1, J. Geerdink2, 3, O.D. Vijlbrief4, 5, C. Seifert1, J.H. Hegeman6, 7
1Universiteit Twente, Enschede, Faculty EEMCS
2ZGT - Ziekenhuislokatie Almelo, ALMELO, Informatie en Organisatie
3ZGT - Ziekenhuislokatie Hengelo, HENGELO OV, Informatie en Organisatie
4ZGT - Ziekenhuislokatie Hengelo, HENGELO OV, Radiologie
5ZGT - Ziekenhuislokatie Almelo, ALMELO, Radiologie
6ZGT - Ziekenhuislokatie Almelo, ALMELO, Traumachirurgie
7ZGT - Ziekenhuislokatie Hengelo, HENGELO OV, Traumachirurgie

Introductie

Kunstmatige intelligentie, en een artificieel neuraal netwerk in het bijzonder, kan gebruikt worden om automatisch heupfracturen te herkennen in röntgenfoto’s en is hierin soms accurater dan radiologen. Maar is een neuraal netwerk wel juist om de juiste redenen? Deze lopende studie analyseert of de redenering achter een voorspelling correct is.

Methode

Neurale netwerken zijn zogeheten ‘black boxes’ die hun voorspelling niet kunnen uitleggen. De plek in een röntgenfoto waar het netwerk het meest naar keek kan echter gehighlight worden. Om te analyseren of het netwerk valsspeelt, verwijderen we dit belangrijkste deel van de röntgenfoto door het grijs te maken. Vervolgens vergelijken we de originele voorspelling met de voorspelling van de bewerkte foto. Bij een correcte redenering zou een foto met fractuur waarop de fractuur automatisch grijs is gemaakt, als ‘niet gefractureerd’ geclassificeerd moeten worden. Wordt de bewerkte foto nog steeds als ‘gefractureerd’ voorspeld, dan baseert het netwerk zich op andere informatie.

Resultaten

  • Getraind op 6533 röntgenfoto’s, voorspelt ons huidige neuraal netwerk 94% van 910 nieuwe röntgenfoto’s correct.
  • 64% van de röntgenfoto’s die correct waren geclassificeerd als ‘gefractureerd’, wordt ongewenst als ‘gefractureerd’ geclassificeerd nadat de fractuur niet meer zichtbaar is. Dit duidt erop dat de voorspelling wordt gebaseerd op andere artefacten in de foto.
  • Verdere analyse duidt erop dat het netwerk:
    • patiënten herkent als het is getraind op röntgenfoto’s uit dezelfde studie en dus heeft onthouden wat de juiste voorspelling moet zijn
    • bepaalde artefacten direct relateert aan een fractuur, zoals een urinaal (zie figuur) en metalen heupimplantaten.

Conclusie

Neurale netwerken kunnen accuraat voorspellen of een fractuur op een röntgenfoto aanwezig is. De redenering achter zo’n voorspelling blijkt echter niet altijd juist. Dit valsspelen kan leiden tot overschatte prestaties en onbetrouwbare voorspellingen. Voorzichtigheid is daarom geboden bij het toepassen van artificiële neurale netwerken in de klinische praktijk.

 

Originele foto. Fractuur aanwezig.

Foto met heatmap. Voorspelling: fractuur.

Automatisch bewerkte foto met heatmap. Voorspelling: fractuur.