Példa nélküli lépésre szánta el magát az amerikai kormány, amely nemzetbiztonsági indokra hivatkozva arra kötelezte az Anthropicot, hogy függessze fel két legfejlettebb mesterségesintelligencia-modellje, a Fable 5 és a Mythos 5 működését. A döntés mindössze három nappal a modellek indulása után érkezett, és gyakorlatilag az egész világot érinti. Az Anthropic közlése szerint június 12-én, helyi idő szerint 17:21-kor kapták meg a washingtoni utasítást, amely előírja, hogy minden külföldi állampolgár számára meg kell szüntetniük a hozzáférést a két rendszerhez. A vállalat szerint ezt technikailag nem lehet megbízhatóan megoldani, mivel valós időben nem tudják minden felhasználóról egyértelműen megállapítani az állampolgárságát. Ennek következtében a Fable 5 és a Mythos 5 teljes lekapcsolása mellett döntöttek, miközben az Anthropic többi modellje továbbra is elérhető maradt.
A Fable 5 június 9-én debütált, és ez volt az első olyan, úgynevezett Mythos-osztályú modell, amelyet a nagyközönség is használhatott. A rendszer biztonsági szűrőkkel működött: a problémásnak ítélt kéréseket automatikusan a gyengébb Claude Opus 4.8 modellhez irányította. A Mythos 5 ezzel szemben ugyanarra az alapmodellre épült, de több kiberbiztonsági korlátozástól mentes változatként kizárólag ellenőrzött szakemberek, kritikus infrastruktúrákat védő szervezetek és biztonsági kutatók számára volt hozzáférhető.
A Trump-adminisztráció már korábban is igyekezett akadályozni a Mythos-program szélesebb körű bevezetését, így a mostani intézkedés nem előzmények nélküli. A vállalat ráadásul a Fable 5-öt eredetileg ingyenesen elérhetővé tette volna Pro, Max, Team és Enterprise előfizetői számára június 22-ig.
A háttérben egy vitatott jailbreak-jelentés állhat. Az Axios értesülése szerint az Amazon azt állította, hogy sikerült áttörnie a Mythos biztonsági védelmét. Az Anthropic szerint azonban csupán egy rendkívül szűk körülmények között működő módszerről van szó, amely lényegében arra épül, hogy a modellt egy konkrét kódbázis elemzésére és hibakeresésére kérik fel.
A vállalat vizsgálata alapján az így feltárt sebezhetőségek jelentéktelenek voltak, ráadásul már korábban is nyilvánosan ismertek. Az Anthropic azt is állítja, hogy más fejlett rendszerek, köztük az OpenAI GPT-5.5 modellje, hasonló hibákat mindenféle biztonsági korlátozás megkerülése nélkül is képesek azonosítani.
A cég hangsúlyozza, hogy jelentős különbség van az úgynevezett szűk jailbreak és az univerzális jailbreak között. Előbbi csak bizonyos helyzetekben képes információkat kinyerni a rendszerből, míg utóbbi lényegében teljesen hatástalanítja a modell védelmi mechanizmusait. Az Anthropic szerint a Fable 5 esetében eddig senki nem talált univerzális jailbreaket, bár a brit AI Safety Institute kutatói rövid idő alatt létrehoztak egy részleges megkerülési módszert egy speciális sérülékenységvizsgálati feladatra.
A vállalat szerint a rajt előtt több ezer órányi tesztelést végeztek amerikai és brit kormányzati szervekkel, valamint külső partnerekkel együttműködve. Egy nyilvános hibavadász program során több mint ezer órányi próbálkozás után sem sikerült univerzális jailbreaket találni a rendszerhez. Az Anthropic emellett egy vitatott, kötelező 30 napos adatmegőrzési szabályt is bevezetett a Fable és a Mythos modellek esetében, felülírva egyes ügyfelek korábbi adatmegőrzés nélküli szerződéseit. Indoklásuk szerint csak így lehet felismerni azokat a visszaélési mintázatokat, amelyek több különálló lekérdezés során rajzolódnak ki.
A cég szokatlanul éles hangvételű közleményben reagált a döntésre. Szerintük elfogadhatatlan, hogy egy feltételezett, korlátozott hatású jailbreak miatt több százmillió ember számára elérhető kereskedelmi terméket visszahívjanak. Az Anthropic úgy véli, ha ez az elv általánossá válik, az gyakorlatilag megbéníthatja az új generációs mesterséges intelligenciák piacra kerülését. A vállalat szerint az ilyen beavatkozásoknak átlátható, egyértelmű és technikai tényeken alapuló jogi eljárás keretében kellene történniük, a mostani lépés pedig szerintük nem felel meg ezeknek a követelményeknek.
Az ügy előzményeként az amerikai védelmi minisztérium korábban nemzetbiztonsági kockázatként sorolta be az Anthropicot, miközben az NSA továbbra is használta a Claude rendszert, mivel nem állt rendelkezésre megfelelő alternatíva. A vállalat emiatt pert indított a kormány ellen. Különösen furcsa helyzetet teremt, hogy ugyanaz az adminisztráció, amely biztonsági fenyegetésként hivatkozik a cégre, közben pénzügyi intézményeket ösztönöz technológiájának használatára, és engedélyezte a Mythos alkalmazását titkosított kormányzati hálózatokon is.
A történet Európában is komoly visszhangot váltott ki. Francia, brit és holland politikusok egyaránt arra figyelmeztettek, hogy az eset újabb bizonyítéka annak, milyen veszélyeket hordoz a külföldi technológiáktól való függőség. Többen is úgy fogalmaztak, hogy a mesterséges intelligencia mára ugyanúgy kritikus infrastruktúrának számít, mint az elektromos hálózat vagy az internet.
Bruno Retailleau francia politikus szerint az ügynek ébresztőként kellene szolgálnia Európa számára, hiszen egy olyan ország, amely mások technológiájára támaszkodik, egyik napról a másikra elveszítheti hozzáférését a legfontosabb eszközeihez. Hasonlóan fogalmazott Benjamin Haddad francia Európa-ügyi miniszter is, aki szerint az amerikai döntés felgyorsítja az MI körüli geopolitikai versenyt, és arra kényszeríti Európát, hogy saját technológiai képességeit fejlessze.
A brit politikusok szintén aggasztónak nevezték a történteket. Al Carns szerint a világ legfejlettebb MI-modelljének lekapcsolása jól mutatja, milyen mértékben függnek más országok technológiai döntéseitől a kutatók, a vállalatok és akár az egészségügyi intézmények is. Tom Tugendhat úgy véli, a szuverenitás fogalma egyre inkább a szoftverkódokhoz kötődik, nem pedig a hagyományos katonai erőhöz. A holland Geert Wilders ennél rövidebben fogalmazott: közösségi oldalán egyszerűen azt írta, hogy vissza akarja kapni a Fable 5-höz való hozzáférését.
Bár egyelőre nem tudni, meddig marad érvényben az amerikai rendelkezés, az ügy már most mérföldkőnek számít az MI-iparág történetében. Ha a mostani precedens fennmarad, a jövőben akár egyetlen jelentett jailbreak is elegendő lehet ahhoz, hogy egy csúcskategóriás modell működését hatósági döntéssel leállítsák. Az Anthropic szerint félreértésről van szó, és bíznak benne, hogy rövid időn belül sikerül visszaállítani a hozzáférést a két rendszerhez.