Az Nvidia határozottan visszautasítja azokat a vádakat, amelyek szerint mesterséges intelligenciás modelljeit kalózforrásból származó könyveken, köztük az Anna's Archive nevű árnyékkönyvtár állományán tanította volna. A vállalat január 29-én benyújtott indítványában azt kérte a kaliforniai szövetségi bíróságtól, hogy utasítsák el a Nazemian kontra Nvidia néven futó pert, mivel az írók nem tudták hitelt érdemlően bizonyítani, hogy konkrét műveiket valóban lemásolták vagy felhasználták volna a tréning során. A keresetet még 2024 elején indították a szerzők, akik szerint az Nvidia több, nyilvánosan elérhető AI-eszközét és referenciamodelljét jogvédett könyvek tömegével tanították, amelyek olyan kétes forrásokból származtak, mint az Anna's Archive vagy a Books3 adatbázis. A módosított beadvány belső vállalati egyeztetésekre hivatkozik, ahol állítólag az Nvidia alkalmazottai érdeklődtek az Anna's Archive elérésének lehetőségeiről, és ezt a felperesek a jogsértés közvetett bizonyítékaként értelmezték.
Az Nvidia jogi csapata azonban azt állítja, hogy mindez messze nem elég. A cég szerint a kereset még az alapvető elemeket sem tartalmazza, amelyek egy szerzői jogi perhez szükségesek lennének. Nem derül ki belőle, hogy pontosan mely műveket másolták le, mikor történt volna a másolás, és mely modellek tartalmaznák ezeket az állítólagos szövegeket. A vállalat álláspontja szerint a felperesek csupán feltételezésekre építenek, és azt várják, hogy majd a per során folytatott bizonyítás derítse ki, történt-e egyáltalán jogsértés. Külön kitértek az Anna's Archive kapcsán felhozott érvekre is. Az Nvidia szerint az, hogy a cégen belül felmerült egy adatforrás megvizsgálása, még nem jelenti azt, hogy onnan ténylegesen letöltöttek volna bármit, pláne nem a konkrét felperesi műveket. A szerzői jogi törvények értelmében a jogsértéshez bizonyítani kell a védett tartalom reprodukálását, puszta érdeklődés vagy tervezgetés erre nem ad alapot. A vállalat jogászai egyenesen úgy fogalmaztak, hogy legalább ugyanannyira valószínű az a forgatókönyv, miszerint az Nvidia végül nem is szerzett be semmit az említett oldalról.
Az indítványban az is szerepel, hogy a felperesek túl tág körben próbálják támadni a céget, különböző modelleket és eszközöket egy kalap alá véve, anélkül, hogy megmagyaráznák, melyik pontosan hogyan és milyen adatokból épült fel. Az Nvidia rámutatott arra is, hogy több állításuk ellentmond a vállalat által közzétett technikai dokumentációknak, amelyek nyilvánosan elérhetők. A kereset újabb eleme az úgynevezett másodlagos felelősség kérdése, amely a NeMo Megatron keretrendszerhez kapcsolódik. A felperesek szerint az Nvidia eszközei megkönnyítették mások számára a nagy nyilvános adatcsomagok, például a The Pile letöltését és felhasználását, ami közvetve szerzői jogi visszaélésekhez vezethetett. A cég viszont azzal érvel, hogy a másodlagos felelősséghez előbb konkrét, harmadik fél által elkövetett jogsértést kellene bizonyítani, ez pedig teljesen hiányzik az iratokból. Önmagában az, hogy egy technológiai eszköz létezik és használható, még nem teszi felelőssé a gyártót az esetleges visszaélésekért.
Az ügy komoly figyelmet kap az AI-iparágban, hiszen egyre több hasonló per indul azzal kapcsolatban, hogy a nagy nyelvi modellek milyen forrásokból tanultak. Az Nvidia szerint azonban ez a kereset tipikus példája annak, amikor a felperesek előbb vádolnak, és csak utána próbálnak bizonyítékot találni. A bíróság április 2-án tárgyalja az indítványt, és akkor dől el, hogy az ügy egyáltalán továbbléphet-e a bizonyítási szakaszba.