Egy friss, a Science-ben megjelent tanulmány szerint egy fejlett AI-modell több sürgősségi diagnosztikai feladatban is jobban teljesített, mint az orvosok, de a kutatók szerint ez nem azt jelenti, hogy a mesterséges intelligencia készen állna önállóan betegeket ellátni. A Harvard Medical School és a Beth Israel Deaconess Medical Center kutatói azt vizsgálták, mire képes egy nagy nyelvi modell, ha nem steril vizsgafeladatokat, hanem valódi, sokszor hiányos és rendezetlen sürgősségi betegadatokat kell értelmeznie. A modell az OpenAI o1-sorozatához tartozott, vagyis olyan rendszer volt, amelyet kifejezetten összetettebb következtetési feladatokra fejlesztettek.
A kutatásban a mesterséges intelligenciát több ellátási ponton is tesztelték, a sürgősségi triázstól egészen a kórházi felvételig. A rendszer minden lépésben csak azokat az adatokat kapta meg, amelyek az adott pillanatban az orvosok számára is elérhetők voltak az elektronikus betegnyilvántartásban. A cél az volt, hogy a modell a rendelkezésre álló, nem előre megtisztított információkból állítson fel valószínű diagnózisokat, és javasoljon következő lépéseket. A Harvard közleménye szerint a modell több feladatban elérte vagy meghaladta gyakorló orvosok teljesítményét.
A TechSpot által is idézett egyik eset jól mutatja, miért izgalmas az eredmény. Egy beteg tüdőembóliával került sürgősségire, állapota előbb javult, majd romlani kezdett. Az orvosok azt gyanították, hogy a kezelés nem működik megfelelően, az AI viszont ugyanazokból az adatokból felvetette, hogy a háttérben korábbi lupus állhat, amely szívgyulladáshoz is vezethet. Ez bizonyult a helyes iránynak.
A számok is erősek, de nem szabad őket félreérteni. A Guardian összefoglalója szerint a modell a sürgősségi triázs során az esetek 67 százalékában találta el a helyes diagnózist, miközben az orvosok 50-55 százalék körül teljesítettek. Amikor több információ állt rendelkezésre, az AI teljesítménye 82 százalékra nőtt. Ezek fontos eredmények, de továbbra is tesztkörnyezetben születtek, nem úgy, hogy a rendszer élesben, valódi betegellátás közben hozott volna önálló döntéseket.
A korlátok legalább ilyen fontosak. A modell kizárólag szöveges kórlapokból és elektronikus egészségügyi adatokból dolgozott, nem látott betegeket, nem hallotta a hangjukat, nem értelmezett testbeszédet, arcszínt, fájdalomreakciót vagy más olyan jeleket, amelyek egy sürgősségi osztályon nagyon is számítanak. A kutatók maguk is hangsúlyozták, hogy az eredmények nem igazolják az orvosok kiváltását, inkább azt mutatják, hogy az AI komoly diagnosztikai támogatórendszerré válhat, különösen ott, ahol kevés az idő és sok a bizonytalanság.
A legnehezebb kérdés ezért nem az, hogy az AI elég okos-e egy-egy diagnosztikai feladathoz, hanem az, hogyan lehet biztonságosan beépíteni a valódi betegellátásba. Egy modell akkor is veszélyes lehet, ha sokszor jól találja el a diagnózist, de közben felesleges vizsgálatokat javasol, rossz sorrendbe rendezi a teendőket, vagy túl magabiztosan ad elő egy bizonytalan következtetést. A Harvard-kutatók szerint ezért most kontrollált klinikai vizsgálatokra van szükség, amelyek nemcsak a pontosságot, hanem a betegbiztonságot és a tényleges ellátási eredményeket is mérik.
A tanulmány ettől még fontos jelzés. Az AI eddig is jól szerepelt orvosi teszteken és tankönyvi eseteken, de a sürgősségi ellátás rendezetlen, hiányos, időnyomásos világa egészen más terep. Ha egy modell ott is hasznos második véleményt tud adni, az hosszabb távon tényleg átalakíthatja az orvosi munkát. Nem úgy, hogy a sürgősségin gépek ülnek az orvosok helyére, hanem úgy, hogy a diagnózis mögött egy új, nagyon gyors és nagyon erős ellenőrző rendszer is dolgozik.