Az OpenAI komoly jogi szorításba került, miután a vállalatnak most már magyarázatot kell adnia arra, miért törölte a hírhedt Books1 és Books2 adatbázisokat, amelyek döntően kalózforrásból, a LibGen árnyékkönyvtárból származó anyagokat tartalmaztak. A szerzők közös keresete szerint ezekből a ChatGPT korai verzióit illegálisan tréningezték, és a törlés körül kialakult ellentmondások akár eldönthetik a pert is. A dokumentumok alapján az adatbázisokat 2021-ben hozták létre, majd még abban az évben kivonták a használatból, ezt követően pedig eltávolították, de a felperesek szerint az OpenAI indoklása gyanúsan változott az idők során, mintha igyekeznének elrejteni a valódi motivációt. A washingtoni bíróság épp ezt a következetlenséget rótta fel, amikor elrendelte az ezzel kapcsolatos belső üzenetek és ügyvédi kommunikáció átadását.
A döntés különösen azért fájdalmas az OpenAI számára, mert az eddig kizárólagosnak mondott ügyvédi titkolózás jelentős része máris megdőlt a bírói vizsgálat során. A Slack-csatornák, köztük a korábban "excise-libgen" néven futó belső projekt, javarészt nem tartalmazott jogi tanácsot, így nem is védhetők a titoktartás mögé. A bíró szerint az OpenAI "ide-oda ugrált" a "nem használtuk" indoklás kommunikálásában, miközben egyszerre állította, hogy ez nem érdemi ok, mégis ügyvédi titoknak számítana. Ez az ellentmondás a bíróság szerint egyértelműen aláássa a cég jóhiszeműségre épített védekezését.
A szerzők célja világos: ha bizonyítható, hogy az OpenAI tudatosan takarta el a jogi kockázatokat, az a szankciók drámai növekedésével járhat, hiszen szándékos jogsértés esetén az egyes művekre kiróható büntetés akár 150 ezer dollárra is emelkedhet. A perben ráadásul kulcsszereplő lehet a ma már az Anthropicot vezető Dario Amodei is, akiről a szerzők úgy gondolják, részt vett az adatbázisok felépítésében és eltüntetésében, amikor még az OpenAI-nál dolgozott. A bíróság őt is meghallgatásra kötelezte, így a következő hetekben akár sorsfordító részletek is napvilágra kerülhetnek.
Az OpenAI a döntést egyelőre vitatja és fellebbezést ígér, de a szakértők szerint a cég saját védekezését gyengítette meg leginkább azzal, hogy egyszerre hivatkozott jóhiszeműségre és ügyvédi titokra, miközben igyekezett elzárni minden, a törlés valódi okaira utaló nyomot. Ha a decemberben átadandó dokumentumok valóban rávilágítanak a háttérfolyamatokra, az könnyen a szerzők javára billentheti az erőviszonyokat - és akár arra is késztetheti az OpenAI-t, hogy a nagy visszhangot kiváltó Anthropic-megállapodás mintájára tárgyalóasztalhoz üljön.