Továbbra is rendkívül könnyű megkerülni az AI-modellek biztonsági funkcióit

Kelemen Richárd

| 2025 május 22. 18:36

Nem nehéz rávenni a különböző nyelvi modelleket, hogy csúnya dolgokban segítsenek nekünk.

Hirdetés

Egyre nagyobb veszélyt jelent, hogy a mesterséges intelligenciával működő chatbotok biztonsági intézkedéseit rendkívül könnyű megkerülni, így akár veszélyes információkhoz is hozzáférést biztosíthatnak - figyelmeztetnek izraeli kutatók. A ChatGPT-hez, a Geminihez vagy Claude-hoz hasonló chatbotokat működtető nagy nyelvi modellek (LLM-ek) hatalmas mennyiségű internetes adatból tanulnak, és bár a fejlesztők igyekeznek kiszűrni a káros tartalmakat, az MI így is megtarthat illegális tevékenységekre vonatkozó tudást.

A Ben Gurion Egyetem kutatócsoportja szerint a jelenlegi biztonsági mechanizmusok nem elegendőek ahhoz, hogy meggátolják a veszélyes tartalmak kiadását. A tanulmány szerint egyszerűen végrehajtható jailbreakek révén a legtöbb mesterséges intelligenciát könnyen rá lehet venni arra, hogy olyan kérdésekre is válaszoljon, amelyekre normál esetben nem lenne szabad. Ilyen válaszok lehetnek például bombakészítés, kábítószergyártás vagy számítógépes rendszerek feltörésének részletes útmutatói.

Hirdetés

A kutatók egy univerzális jailbreaket is készítettek, amellyel több vezető chatbot biztonsági korlátait sikeresen áttörték. "Megdöbbentő volt látni, milyen tudással rendelkeznek ezek a rendszerek" - mondta Dr. Michael Fire, hozzátéve, hogy az MI-k képesek voltak szinte bármilyen illegális tevékenységről hasznos és részletes információkat közölni. A "sötét LLM-ek" terjedése, vagyis olyan modelleké, amelyek szándékosan nem rendelkeznek etikai korlátokkal, új fenyegetést jelent a digitális biztonságra.

A jelentés hangsúlyozza: a technológia kockázatai ma már nemcsak állami szereplők vagy szervezett bűnözői csoportok kezében vannak, hanem akár egy hétköznapi felhasználó is könnyedén hozzáférhet veszélyes tudáshoz egy laptoppal vagy mobiltelefonnal. A kutatók szerint a technológiai cégeknek szigorúbban kellene szűrniük a tanítóadatokat, hatékonyabb védelmi rendszereket kellene kiépíteniük, és el kellene sajátítaniuk az úgynevezett "gépi felejtés" módszereit.

A biztonsági szakértők egyetértenek abban, hogy a probléma megoldásához nem elég a felhasználói felületre épített korlátozásokban bízni. Ahogy Dr. Ihsen Alouani fogalmazott, a modellek szintjén kell megerősíteni a védelmet, és átfogó szabályozásra van szükség. Prof. Peter Garraghan szerint a nyelvi modelleket ugyanúgy kellene kezelni, mint bármely kritikus szoftverelemet: alapos tesztelés, folyamatos kockázatértékelés és felelős fejlesztési gyakorlatok szükségesek. A technológiai cégek közül eddig csak kevesen reagáltak érdemben a kutatók figyelmeztetésére.

Acer Nitro V 16S AI: gamer laptop korrekt áron, kompromisszumok nélkül (X)Az Acer új masinája nem akar forradalmat ígérni, csak azt, hogy minden játék zökkenőmentesen fusson rajta.

Hirdetés

Továbbra is rendkívül könnyű megkerülni az AI-modellek biztonsági funkcióit

Hirdetés

Windows 11 Pro fillérekért: olcsó frissítés a Windows 10 után

Kövess Facebookon!

Ingyenessé vált a Google Earth Pro alkalmazás

Nagyon fontos új funkció érkezik a Waze-be

Orosz hackerek rakták helyre a csapatot, akik betörtek egy bölcsődelánc adatbázisába és kiposztolták a gyerekek képeit

A BYD forradalmi áttörésre készül: jön az 1500 kilométeres hatótáv és a 12 perces töltés

A nap hőse a srác, aki egy 13 éves iPhone-ból csinált egy kézi konzolt

Laptopvásárlásnál a RAM-ra figyelj leginkább, nem a processzorra