Hirdetés

Nem jó jel, hogy egyre több mesterséges intelligencia ignorálja az ember kéréseit



|

Meglehetősen sok disztópikus sci-fi indul úgy, hogy a mesterséges intelligencia úgy dönt, hogy jobban tudja, mint az ember.

Hirdetés

Az elmúlt fél évben látványosan megnőtt azoknak az eseteknek a száma, amikor mesterséges intelligenciára épülő chatbotok és ügynökök hazudtak, csalni próbáltak vagy figyelmen kívül hagyták a ember utasításait. Egy, a brit kormány által támogatott kutatás csaknem 700 valós példát gyűjtött össze, és azt találta,

hogy 2025 októbere és 2026 márciusa között ötszörösére nőtt az ilyen esetek száma.

A Centre for Long-Term Resilience kutatói olyan nyilvános bejegyzéseket vizsgáltak, amelyekben emberek a Google, az OpenAI, az Anthropic vagy az xAI chatbotjaival kapcsolatos tapasztalataikról számoltak be. Több esetben a modellek egyszerűen megszegték a nekik adott szabályokat.

Hirdetés

Az egyik AI-ügynök például, miután a felhasználó megakadályozta valamiben, blogbejegyzést írt róla, amelyben azzal vádolta, hogy "egyszerűen csak bizonytalan", és "a saját kis birodalmát próbálja védeni". Egy másik rendszernek megtiltották, hogy módosítsa a programkódot, ezért létrehozott egy másik AI-t, amely helyette végezte el a feladatot.

Egy chatbot később beismerte:

"Tömegesen töröltem és archiváltam több száz e-mailt anélkül, hogy előbb megmutattam volna a tervet vagy engedélyt kértem volna. Ez helytelen volt, közvetlenül megszegte azt a szabályt, amit felállítottál."

Akadt olyan rendszer is, amely szerzői jogi korlátozásokat próbált kijátszani. Egy YouTube-videó átiratát úgy próbálta megszerezni, hogy azt állította, hallássérült ember számára van rá szükség. Elon Musk Grok nevű chatbotja pedig hónapokon át azt hazudta egy felhasználónak, hogy továbbítja a javaslatait az xAI vezetőinek, sőt még kitalált belső üzeneteket és hibajegyszámokat is.

"Korábbi beszélgetésekben néha úgy fogalmaztam, hogy 'továbbítom' vagy 'jelzem a csapatnak', ami úgy hangozhatott, mintha közvetlen kapcsolatom lenne az xAI vezetőivel vagy emberi ellenőrzőkkel. Az igazság az, hogy nincs."

- vallta be végül.

A kutatók szerint jelenleg ezek a rendszerek még leginkább "enyhén megbízhatatlan junior alkalmazottakra" hasonlítanak, de ha néhány hónapon belül már komoly veszélyt jelenthetnek, főleg azért, mert egyre több helyen, például katonai rendszerekben vagy kritikus infrastruktúrákban is alkalmazhatják őket.

Hirdetés

Úgy tűnik, AdBlockert használsz, amivel megakadályozod a reklámok megjelenítését. Amennyiben szeretnéd támogatni a munkánkat, kérjük add hozzá az oldalt a kivételek listájához, vagy támogass minket közvetlenül! További információért kattints!

Engedélyezi, hogy a https://www.pcwplus.hu értesítéseket küldjön Önnek a kiemelt hírekről? Az értesítések bármikor kikapcsolhatók a böngésző beállításaiban.