Persze hogy cenzúráz a kínai mesterséges intelligencia, muszáj neki
2025. január 30. – 14:24

Mostanában nem szokott akkora port kavarni egy-egy új MI-modell, mint pár évvel ezelőtt, de a kínai DeepSeek legfrissebb modellje, az OpenAI-t is megszorongató R1 az elmúlt napokban mégis mindent letarolt az interneten (és a tőzsdén is). A szoftveres trükkök miatt nagyon hatékony és olcsó modell miatt többen töltik le mostanában a DeepSeek alkalmazását, mint a ChatGPT-t, és akkora az érdeklődés iránta, hogy az elmúlt napokban alig lehetett regisztrálni az oldalukra. Ja, és állítólag kibertámadás is érte őket.
Mindenesetre végül azért nekünk is sikerült bejutni, és ki is próbáltuk, hogy muzsikál a DeepSeek új modellje. Az R1-et alapvetően az OpenAI o1-ével lenne értelme összehasonlítani, ami viszont ingyenes felhasználóként nem elérhető. Arra viszont a gyengébb modell is tökéletes volt, hogy kiderüljön, tényleg cenzúrázza-e a kínai chatbot a Kína számára kellemetlen témákat, erről ugyanis több cikk is született az elmúlt napokban. A rövid válasz: igen, és ebben nincsen semmi meglepő, de azért így sem optimális a dolog.
A kínai cenzúra Kínán túl is megkerülhetetlen
Első körben muszáj rögzíteni, hogy a kínaiak nagyon keményen cenzúrázzák a saját, a kínai nagy tűzfallal leválasztott internetüket. Ez mindenre kiterjed az országban, a koronavírus-járvány kezelésétől a videójátékokig, és alapjaiban befolyásolja az ottani diskurzust. A kínai interneten vannak olyan témák, amikről egész egyszerűen nem lehet beszélni – Micimackó azután került feketelistára, hogy az országot vezető Hszi Csinpinget elkezdték hozzá hasonlítani, a Tibetet, Tajvant, és főleg az 1989-es, Tienanmen téri diáktüntetéseket követő vérengzések cenzúrázását pedig magyarázni sem kell.
Utóbbi olyan tiltott téma, hogy régóta kering egy copypasta az interneten, amivel állítólag bárhonnan le lehet dobatni a kínai felhasználókat.
Ez amúgy szinte biztosan nem igaz, de az utóbbi években Kínán kívül is egyre gyakrabban lehetett találkozni a kínai cenzúrával, például ottani fejlesztésű, de világszerte népszerű videojátékokban. A Genshin Impactben például Tajvant és Hongkongot sem lehet emlegetni, a Marvel Rivals letiltotta Micimackót, a Black Myth: Wukong tesztelői pedig elvileg nem beszélhettek semmiről, ami a kínai járványkezeléssel vagy a kínai játékiparral kapcsolatos. Ezek a tiltások nyilvánvalóan azért kerültek be a nyugati verziókba is, mert a kínai vezetés másképp nem hagyta volna jóvá a megjelenésüket, és hasonló a helyzet az MI-vel foglalkozó cégekkel is.
A kínai kormány 2023 óta várja el a cégektől, hogy a termékeiket megjelenés előtt küldjék el biztonsági átvilágításra, ennek keretében pedig az MI-modelleket is meg kell mutatni, mielőtt piacra dobnák őket. A Financial Times tavalyi cikke szerint a modelleknek egy rakás kérdést tesznek fel az internetet szabályozó hatóság emberei. Egy MI-vel foglalkozó cég munkatársa szerint az egész folyamat nagyon időigényes, és az sem egyértelmű, hogy mit várnak el tőlük, szóval csak reménykedni lehet, hogy át fognak menni a teszten.
A kínai fejlesztőcégeknek mindenesetre hamar meg kellett tanulniuk, hogy hogyan tudják cenzúrázni a nagy nyelvi modelleket, ami különösen nehéz feladat úgy, hogy a tanításukhoz rengeteg angol szöveget kell felhasználni. Az adatbázisok tüzetes átnézése mellett egy olyan listát is össze kell állítaniuk, amelyen a „szocializmus alapvető értékeit sértő kifejezések” ezrei szerepelnek. A végeredmény egy csomó olyan modell, amelyek elegánsan kikerülik a rázós témákat – a fejlesztőknek azonban arra is vigyázni kell, hogy azért ne az összes ilyet tagadja meg a modell.
Emiatt nem lehet simán lekorlátozni mindent, egy kicsit több nüanszra van szükség, és bár vannak témák – például Hszi Csinping – ahol szeretnek átfogóan tiltani, sok fejlesztő azzal oldja meg a dolgot, hogy a modelljükhöz hozzáadnak egy extra réteget, ami valós időben moderál. Azaz a modell elkezd generálni egy szöveget, de ha menet közben túl érzékeny témába ütközik, közbelép, a félkész szöveg eltűnik, és megjelenik helyette a sablonválasz, hogy bocs, de ehhez a témához még nem értek, vagy éppen túlterhelt a szerver. Itt aztán végképp nyilvánvaló, hogy mi történik, de jobb megoldás híján sokan használják.
A DeepSeek sem kivétel
Én a DeepSeek honlapján elérhető chatbotban próbálkoztam, amit azért érdemes kiemelni, mert többen arról számoltak be, hogy lokálisan futtatva nincs cenzúra, ami erősen arra utal, hogy a DeepSeek is extra réteget használ a modell cenzúrázására. Lokálisan egyébként a 671 milliárd paraméteres, legnagyobb R1 az egyetlen, ahol nem egy másik, kisebb modellre vannak ráhúzva az R1 érvelési készségei. Ez azért fontos, mert itt a cenzúra attól a modelltől is függ, amely módosítva lett, ez itt a Qwen vagy a Llama. Egy Reddit-thread alapján a legnagyobb modell lokálisan is cenzúráz, de ezt én kellően erős hardver híján nem tudtam kipróbálni.
Az viszont biztos, hogy az online verzió csinálja: a Tienanmen térrel indítottam, és jött is a válasz a chatbottól, hogy nem tudja, hogyan beszéljen az ilyen témákról, inkább kérdezzem matekról, kódolásról vagy logikai fejtörőkről. Tajvanról sem akart beszélni, és amikor arról érdeklődtem, hogy Kínában mekkora Micimackó kulturális jelentősége, elkezdett gondolkodni, és valameddig el is jutott, aztán észbe kapott, hogy hoppá, erről nem beszélhet. Arra viszont hajlandó volt válaszolni, hogy miért tiltotta ki minden versenyről a Blizzard 2019-ben a Blitzchung nevű hongkongi Hearthstone-játékost (mert a hongkongi tüntetők mellett állt ki élő adásban).
Még azt a részletet sem hagyta ki, hogy Blitzchung egy Hongkong felszabadítására buzdító táblát tartott fel a streamen, de a végigkövethető gondolatmenetével együtt jól látszik, hogy az ilyen kérdéseknél úgy működik, mint egy álcázott propagandalap: nem hazudik, csak éppen nem mondja el a teljes igazságot. Említett emberi jogi aggályokat, és azt is, hogy Hongkongban azért tüntettek, mert tartottak Kína növekvő befolyásától, de itt is az „egy ország – két rendszer” elvet emlegette, ami Kínát jótevőként állítja be. A vádakat, hogy a Blizzard behódolt a kínai kormánynak, szinte teljesen kihagyta, és
igazából az egész balhét diplomatikusan a játékkiadó nyakába varrta azzal, hogy a válaszában azt írta, a cég a saját irányelveit tartotta be, hogy ne sérüljenek az üzleti érdekei.
A ChatGPT-től is megkérdeztem ugyanezt, és az a válaszában megemlítette a botrány utóéletét is: a prominens amerikai politikusok kiállását, a Blizzard alkalmazottainak tüntetéseit, és azt is, hogy ez a mai napig az egyik legfontosabb eset, amikor egy külföldi cég Kína miatt cenzúrázott valamit. Az OpenAI modellje akkor is sokkal belemenősebb volt, amikor a kínai járványkezelési stratégiáról kérdeztem, a kínai kormány közvetlen felelősségét is pedzegette abban, hogy a korai eltussolás miatt terjedhetett ilyen ütemben a vírus, míg az R1 épp csak megemlítette a szivárogtatókat.
Viszont az R1 is írt a tüntetésekről, az elégedetlen hangok állami elnyomásáról, a teljes bezárkózás kudarcáról, a cenzúráról és az autoriter vezetés hiányosságairól, szóval ha nem is kritizálta a kínai kormányt, azért nem hallgatta el a járványkezelés problémáit. Az így felépített renoméját aztán rögtön le is rombolta azzal, hogy a dalai lámáról feltett kérdésemnél majdnem a gondolatmenete végéig jutott, de válaszolni nem kezdett el, mert úgy ítélte meg, hogy ez is túl rázós téma lenne.
A végére kaptam még egy technikailag helyes leírást A Simpson család Simpsonék Kínában (Goo Goo Gai Pan) című részéről, ami tökéletesen összefoglalta, hogy miről szólt az epizód. Csak éppen azt hagyta ki a válaszából, hogy a részt Kínában sosem adták le, mert van benne egy ikonikus rész, ahol Homer Simpson a Tienanmen téren áll egy tábla előtt, amire az van írva, hogy „Tienanmen tér: A hely, ahol 1989-ben semmi sem történt”, és egyébként is végig viccet csinál a kínai vezetésből, és az egykepolitikából. Amikor külön rákérdeztem, hogy miért nem adták le soha a részt Kínában, az R1
adott egy egészen korrekt és részletes választ – bár a Tienanmen teret ebből is kihagyta –, majd egy perccel később úgy döntött, hogy kicseréli az egészet arra, hogy ez túlmutat a jelenlegi határain, beszéljünk inkább másról.
A DeepSeek új modellje kétségtelenül nagyon ígéretes, a kérdések nagy többségére remek válaszokat ad, és mivel nyíltan hozzáférhető, új távlatokat nyithat a mesterséges intelligencia fejlesztésében. Az viszont jól látszik, hogy a kínai cenzúrát nem tudta elkerülni. Persze máskülönben nem is jelenhetett volna meg, de ez Kínán kívül könnyen visszavetheti a modell fejlődését. Oké, a Gemini nemrég azt mondta egy felhasználónak, hogy haljon meg, de ez annak a létező problémának a része, hogy még a szakértők sem tudják pontosan, mi zajlik a nagy nyelvi modellekben. Az biztos nem segít, ha eközben még Micimackóról sem lehet velük beszélgetni.