A mesterséges intelligenciáról szóló diskurzus az utóbbi időben mintha egyre inkább hasonlítana egy bűvészműsorra: mindenki látni véli a varázslatot, de csak azért, mert nagyon szeretné elhinni, hogy az valódi. Egy új kutatás szerint pontosan ez a fajta önámítás állhat a mögött is, hogy miért gondolják sokan sikeresnek az AI-eszközök használatát, miközben a valós adatok ennek ellentmondanak.
A METR kutatólabor nemrég publikálta az első randomizált, kontrollált vizsgálatot arról, hogyan befolyásolják az AI-eszközök a programozók teljesítményét. A kísérletben tapasztalt fejlesztők dolgoztak különböző feladatokon, részben AI segítségével, részben anélkül. Az eredmények meglepték a kutatókat: a résztvevők szinte egyöntetűen úgy érezték, hogy AI-t használva 20 százalékkal gyorsabbak, miközben a valóságban 19 százalékkal lassabban dolgoztak. Magyarán: nemcsak hogy nem volt hatékonyabb a mesterséges intelligencia, de konkrétan hátráltatta őket.
Ez az ellentmondás önmagában is figyelemre méltó, de igazán az a tanulságos, hogy a résztvevők mennyire meg voltak győződve az ellenkezőjéről. A METR szerint ez világosan mutatja: az emberek gyakran akarják elhinni, hogy az AI segít nekik, akkor is, ha a saját tapasztalataik, vagy a kísérleti adatok mást mondanak. Mintha már csak a hiedelem is képes lenne elfedni a valóságot.
Pedig az AI-csoda körüli optimizmus egyre inkább repedezik. Egy IBM-felmérés szerint az AI-projektek 75 százaléka nem hozott kézzelfogható megtérülést, a Carnegie Mellon és a Salesforce közös kutatása pedig azt találta, hogy az AI-alapú ügynökök a feladatok 65-70 százalékát elbukják. A Gartner piackutató szintén kijózanító következtetésekre jutott: a jelenlegi modellek nem képesek komplex célokat követni vagy hosszú távon megbízható utasításvégrehajtásra.
Nem véletlen, hogy egyre több cég (mint a tavaly AI-mámorban leépítéseket végrehajtó Klarna) kezd újra embereket felvenni. Mint ahogy az sem véletlen, hogy a legnagyobb ígéretek és benchmark-rekordok mögött gyakran kevés valós előrelépés áll. A szakértők ezt ChatGPT-vakságnak nevezik: amikor valaki elismeri, hogy a saját szakterületén gyenge az AI, de mégis azt hiszi, hogy más területeken biztosan zseniálisan működik.
A közösségi média és a technológiai marketing mindezt még fokozza. A wowslop típusú posztok (csodálkozó bejegyzések minden új AI-eszköz kapcsán) folyamatosan gerjesztik a hype-ot. Eközben a valóság továbbra is az, hogy a generatív AI nem megbízható, nem tud következetesen érvelni, és néha még egy 1977-es Atari konzol is jobb nála, ahogy azt egy nemrégiben bemutatott kísérlet is igazolta.
Ez nem jelenti azt, hogy az AI-nak ne lenne helye a világban. Fordításnál, vázlatkészítésnél, szövegösszefoglalásnál vagy egyes kutatási céloknál valóban hasznos lehet. De amikor a vállalatok több százmilliárd dollárt öntenek bele, abban a hitben, hogy ez az új ipari forradalom, akkor érdemes elgondolkodni: nem épp az önámítás fűti tovább ezt az álmot?
A METR vizsgálatában volt még egy különösen szórakoztató elem: a leginkább túlzott várakozásokkal bíró csoport nem más volt, mint a közgazdászok.