AI denkt als een arts — en presteert beter dan echte dokters op moeilijke gevallen
Een nieuw type kunstmatige intelligentie, dat stap voor stap redeneert zoals een arts, versloeg menselijke dokters op complexe diagnoses met rommelige, echte patiëntdata.
De droom van een ‘computerdokter’ bestaat al sinds 1959. Maar pas nu, met de opkomst van grote taalmodellen, begint die droom tastbare contouren te krijgen. Eerdere studies die AI vergeleken met artsen werden vaak bekritiseerd: de testcondities waren te netjes, de vragen te voorspelbaar. In werkelijkheid zijn patiëntendossiers rommelig, onvolledig en vol tegenstrijdige informatie. Deze nieuwe studie testte een zogenoemd ’thinking model’ — een AI die niet meteen antwoord geeft, maar eerst een redeneerproces doorloopt — op échte klinische data.
Het resultaat was opvallend. Het AI-model overtrof menselijke artsen op meerdere taken: het stellen van diagnoses, het aanbevelen van behandelingen en het omgaan met incomplete of tegenstrijdige informatie uit patiëntendossiers. Niet in kunstmatige quizvragen, maar in scenario’s die de rommeligheid van de echte klinische praktijk weerspiegelden. De artsen in de studie waren geen beginners — het ging om ervaren klinische specialisten.
Wat maakt een ’thinking’ AI anders?
Reguliere taalmodellen geven direct een antwoord op basis van patroonherkenning. Een ’thinking model’ doet iets anders: het simuleert een redeneerproces, weegt hypotheses af, sluit alternatieven uit en corrigeert zichzelf tussentijds. Dat klinkt eenvoudig, maar het maakt een groot verschil bij complexe medische vraagstukken waarbij meerdere aandoeningen tegelijk een rol kunnen spelen. In de longevity-context is dat bijzonder relevant: oudere patiënten hebben vaak meerdere aandoeningen tegelijk, en juist daar faalt standaard diagnostiek het vaakst.
De studie benadrukt ook waar AI nog tekortschiet. Fysiek onderzoek kan een AI niet uitvoeren. De relatie met een patiënt — het vertrouwen, het non-verbale signaal dat iets niet klopt — blijft buiten bereik. En hoewel het model goed scoorde op redeneren, betekent dat niet dat het altijd de juiste beslissing neemt in de volle complexiteit van een mensenleven.
Van lab naar spreekkamer: de echte hindernis
De kloof tussen ‘AI doet het goed in een studie’ en ‘AI wordt verantwoord ingezet in ziekenhuizen’ is enorm. Regulering, aansprakelijkheid, privacy en integratie in bestaande systemen zijn obstakels die jaren van werk vergen. Bovendien rijst de vraag wat er gebeurt als artsen te veel op AI gaan leunen en hun eigen diagnostische scherpte verliezen — een fenomeen dat bij andere technologieën al is beschreven als ‘automation bias’.
Desondanks is deze studie een mijlpaal. Voor het eerst is aangetoond dat AI onder realistische omstandigheden menselijke artsen kan overtreffen op redenering en behandeladvies. Dat opent vragen die de geneeskunde de komende decennia zullen bezighouden: wanneer vertrouw je een algoritme meer dan een mens, en wie is er verantwoordelijk als het misgaat?