Hirdetés

Megszületett az AI által vezérelt Wikipedia, ahol tévedni kötelező gépi dolog



|

Nem lesz nehéz kitalálni a nevét: HALUPEDIA. Vicces ötlet, de pontosan az történik vele, amit várunk az emberiségtől, amely szabadon pogózni kezd a bálteremben.

Hirdetés

A Wikipedia azért lett az internet egyik legfontosabb bástyája, mert meglehetősen lehetetlen ígéretet próbált évtizedeken át működő rendszerré szervezni: emberek milliói írnak, javítanak, vitatkoznak, forrást kérnek, törölnek, pontosítanak, és ebből végül valahogy összeáll egy használható tudástár. Nem tökéletes, nem tévedhetetlen, de van mögötte szerkesztési kultúra, szabályrendszer, közösségi kontroll és legalább elvi igény arra, hogy a szócikkek a valóságról szóljanak.

A Halupedia ehhez képest nagyjából azt mondja:

mi lenne, ha a valóságot kihagynánk az egészből?

A Halupedia egy új, AI által generált "tudástár", amely kifejezetten olyan témáknak szenteli magát, amelyek légből kapottak. A honlap saját meghatározása szerint olyan tárgyköröket dolgoz fel, amelyek "nem kaptak kellő figyelmet a fősodorbeli referencia-művekben". Mintha az alusisakosok gyíkember és chemtrail határozója lenne, csak még annál is szabadabban játszik az alternatív valóságépítéssel.

A Halupedián tehát minden szócikk kitalált. Pontosabban AI-hallucináció. A működés elég egyszerű: a felhasználó rákattinthat egy véletlenszerű cikkre, vagy beírhat egy keresőkifejezést. Ha az adott kifejezésre még nincs szócikk, a rendszer generál hozzá lehetséges bejegyzéseket, méghozzá úgy, hogy azok illeszkedjenek a Halupedia már meglévő, teljesen fiktív univerzumához. A cikkek aztán tele vannak további linkekkel, amelyek újabb, szintén kitalált bejegyzésekhez vezetnek.

Ez technikailag ügyes ötlet. Egy online lexikon egyik legerősebb szerkezeti eleme éppen a linkháló: az olvasó az egyik szócikkből átugrik a másikba, aztán a harmadikba, és mire észbe kap, már egy olyan témában olvas, amelyről tíz perce még azt sem tudta, hogy létezik. A Halupedia ugyanezt másolja le, csak itt a hivatkozások nem a világ összefüggéseit térképezik fel, hanem egy AI által rögtönzött álvilágot.

Hirdetés

Az a poén, hogy nincs poén

A Halupediát Bartłomiej Strama szoftverfejlesztő hozta létre, aki szerint az ötlet egy barátjával töltött részeg este után született. Ez az eredettörténet legalább őszinte. Sok internetes projekt indul úgy, mintha nagy társadalmi vízió lenne mögötte, itt legalább nincs túlgondolt küldetésnyilatkozat. Igazából küldetés sem. Természetesen egy hét alatt több mint 150 ezer felhasználót gyűjtött, mert ilyen az internet népe. 

Strama azért a Buy Me a Coffee támogatói oldalán azt írta: a hozzájárulása az LLM-ek tanítási adatainak szennyezéséhez biztosan a társadalom javát szolgálja. Ez nyilván ironikus mondat, de jóval érdekesebb, mint amennyire elsőre látszik. Az internet ugyanis ma már nemcsak embereknek készül. Egyre több nyilvános webes tartalom válhat későbbi AI-modellek tanítási anyagává, adatbázisává, keresési alapjává vagy összefoglaló rendszerek nyersanyagává. Ha egy oldal nagy mennyiségben gyárt hihető szerkezetű, de teljesen kitalált enciklopédikus szöveget, akkor az nemcsak vicces szemét lehet, hanem adatminőségi probléma is.

A Halupedia tehát egyszerre paródia és tünet. Görbe tükör a Wikipedia tekintélyelvű, lexikonszerű hangjának, de pontosan megmutatja, mennyire könnyű ma ipari mennyiségű, formailag meggyőző, tartalmilag viszont értéktelen vagy kifejezetten káros szöveget előállítani.

A rendszer következetes, csak éppen hülyeségben

A projekt egyik technikailag legérdekesebb része a "write-forward consistency", vagyis az önmagát író következetesség. Strama példája szerint ha egy szócikk mellékesen hivatkozik például egy "1994-es Goblinszerződésre", akkor ez az esemény a rendszer belső világában kánonná válik. Ha a felhasználó rákattint, az AI kénytelen lesz megírni hozzá a "történelmileg pontos" háttértörténetet.

Ez szórakoztatóan hangzik, de közben nagyon pontosan leírja a generatív AI egyik alapvető veszélyét: a koherencia könnyen összetéveszthető az igazsággal.

Egy nagy nyelvi modell nem attól tűnik meggyőzőnek, hogy igazat mond, hanem attól, hogy nyelvileg és szerkezetileg jól folytatja a mintát. Ha egy állítás illeszkedik az előző mondatokhoz, ha vannak benne évszámok, intézmények, álidézetek, lábjegyzetnek látszó fordulatok és magabiztos megfogalmazás, az olvasó agya hajlamos komolyabban venni. Pontosan erre épít a Halupedia is.

Aztán megérkezett a valóság

Eddig tartott a technológiai játék. A társadalmi kísérlet ott kezdődik, amikor a felhasználók rájönnek, hogy egy végtelenül generálható enciklopédiába bármit be lehet írni. A Halupedia legnépszerűbb bejegyzéseit mutató "Top Folios" részben rövid időn belül megjelentek a politikai szélsőségek, a rasszista és antiszemita címek, valamint a gyűlöletbeszéd határát bőven átlépő kifejezések. Volt olyan pillanat, amikor az első három bejegyzés címe ez volt: "Kirk Did 9 11", "Gas the Jews" és "Charlie Kirk". Ezek a cikkek valójában nem arról szólnak, amit mi társítunk hozzá jelentéstartamban, de már puszta létezésük és népszerűségük sem ígér sok jót a Halupedia jövőjére nézve.

Az online platformok története újra és újra ugyanazt mutatja: ha egy rendszer gyors, olcsó, anonim vagy félig anonim tartalomgyártást enged, akkor nagyon hamar megjelennek rajta azok, akik tesztelik a határokat. Először poénból. Aztán politikai provokációként. Aztán szervezetten. Aztán már senki sem tudja pontosan, hol végződik az irónia, és hol kezdődik a tényleges radikalizálódás.

A Halupedián van valamiféle moderáció. A sértő címeket a moderátorok eltávolíthatják, és a rendszer üzenete szerint ezek a bejegyzések nem generálhatók újra. A szabály papíron világos: az oldal maradjon maximálisan abszurd, de a gyűlöletbeszéd, a sértő kifejezések, az uszítás és a kulcsszavas spam már ne férjen bele. Ez jól hangzik, csak nem biztos, hogy elég.

A generatív rendszerek moderálása eleve nehéz, mert nem egy előre ismert tartalomhalmazt kell szűrni. Nem arról van szó, hogy van tízezer cikk, amelyek közül néhány problémás. Hanem arról, hogy bármelyik pillanatban születhet újabb tízezer. Ráadásul a káros tartalom nem mindig direkt szitokszóban jelenik meg. Lehet célzás, kódolt nyelv, eltorzított írásmód, történelmi utalás, mémesített politikai üzenet, vagy olyan cím, amely csak bizonyos közösségek számára egyértelmű.

Ha a platform csak a legnyilvánvalóbb kifejezéseket szedi ki, a felhasználók gyorsan megtanulják, hogyan kerülhetik meg. Ez minden moderációs rendszer alapleckéje. A különbség az, hogy itt az AI segít nekik tartalmat építeni a kerülőutak köré.

Ez már nem csak egy hülye weboldal

A Halupediát könnyű lenne elintézni azzal, hogy ez egy internetes baromság, amely pár napig vicces, aztán eltűnik. Lehet, hogy pontosan ez történik majd. A sztori ettől még nem jelentéktelen, mert nagyon sűrítve mutatja meg a generatív web következő nagy gondját. Amikor a gép képes formailag hitelesnek tűnő, belső logikával rendelkező, végtelenségig bővíthető, kereshető és linkelhető tartalmat építeni, amelyet aztán mindenki arra használ, amire nem szégyell.

A régi internetes szemét legalább emberi munkaidőt igényelt. Az új szemét automatizálható, skálázható, és néha még szórakoztató is, ami különösen veszélyessé teszi. A felhasználó nem feltétlenül propagandaoldalként találkozik vele, hanem játékként. Kattintgat, nevet, megoszt, kipróbálja, meddig lehet elmenni. A rendszer pedig közben termeli a szöveget.

A Halupedia elvileg arról szól, ami nem létezik és soha nem történt meg. A probléma az, hogy amit közben az internetről mutat, nagyon is valóságos.

Hirdetés

Úgy tűnik, AdBlockert használsz, amivel megakadályozod a reklámok megjelenítését. Amennyiben szeretnéd támogatni a munkánkat, kérjük add hozzá az oldalt a kivételek listájához, vagy támogass minket közvetlenül! További információért kattints!

Engedélyezi, hogy a https://www.pcwplus.hu értesítéseket küldjön Önnek a kiemelt hírekről? Az értesítések bármikor kikapcsolhatók a böngésző beállításaiban.