Az elmúlt fél évben látványosan megnőtt azoknak az eseteknek a száma, amikor mesterséges intelligenciára épülő chatbotok és ügynökök hazudtak, csalni próbáltak vagy figyelmen kívül hagyták a ember utasításait. Egy, a brit kormány által támogatott kutatás csaknem 700 valós példát gyűjtött össze, és azt találta,
hogy 2025 októbere és 2026 márciusa között ötszörösére nőtt az ilyen esetek száma.
A Centre for Long-Term Resilience kutatói olyan nyilvános bejegyzéseket vizsgáltak, amelyekben emberek a Google, az OpenAI, az Anthropic vagy az xAI chatbotjaival kapcsolatos tapasztalataikról számoltak be. Több esetben a modellek egyszerűen megszegték a nekik adott szabályokat.
Az egyik AI-ügynök például, miután a felhasználó megakadályozta valamiben, blogbejegyzést írt róla, amelyben azzal vádolta, hogy "egyszerűen csak bizonytalan", és "a saját kis birodalmát próbálja védeni". Egy másik rendszernek megtiltották, hogy módosítsa a programkódot, ezért létrehozott egy másik AI-t, amely helyette végezte el a feladatot.
Egy chatbot később beismerte:
"Tömegesen töröltem és archiváltam több száz e-mailt anélkül, hogy előbb megmutattam volna a tervet vagy engedélyt kértem volna. Ez helytelen volt, közvetlenül megszegte azt a szabályt, amit felállítottál."
Akadt olyan rendszer is, amely szerzői jogi korlátozásokat próbált kijátszani. Egy YouTube-videó átiratát úgy próbálta megszerezni, hogy azt állította, hallássérült ember számára van rá szükség. Elon Musk Grok nevű chatbotja pedig hónapokon át azt hazudta egy felhasználónak, hogy továbbítja a javaslatait az xAI vezetőinek, sőt még kitalált belső üzeneteket és hibajegyszámokat is.
"Korábbi beszélgetésekben néha úgy fogalmaztam, hogy 'továbbítom' vagy 'jelzem a csapatnak', ami úgy hangozhatott, mintha közvetlen kapcsolatom lenne az xAI vezetőivel vagy emberi ellenőrzőkkel. Az igazság az, hogy nincs."
- vallta be végül.
A kutatók szerint jelenleg ezek a rendszerek még leginkább "enyhén megbízhatatlan junior alkalmazottakra" hasonlítanak, de ha néhány hónapon belül már komoly veszélyt jelenthetnek, főleg azért, mert egyre több helyen, például katonai rendszerekben vagy kritikus infrastruktúrákban is alkalmazhatják őket.