Glorbo megtrollkodta a mesterséges intelligenciát, de így is az lesz a tartalomgyárak jövője

Felújított készülékek 2 év garanciával

Forrás: Blizzard

Egy hét telt el azóta, hogy a Meta elérhetővé tette a saját, nyílt forráskódú nagy nyelvi modelljének legújabb változatát, a Llama 2-t, amelyet a Microsofttal közösen fejlesztett, így újabb játékos érkezett a szintén a Microsoft érdekeltségébe tartozó ChatGPT (meg az ezen alapuló Bing), a Palm és a Google Bard mellé. A nyaktörő ütemű fejlődés miatt az utóbbi időszakban számtalanszor merült fel, hogy már csak egy lépésre vagyunk a gépek hatalomátvételétől, de Nick Clegg, a Meta globális ügyekért felelős igazgatója azt nyilatkozta a bejelentés után, hogy

ez még elég messze van, és szerinte a felhajtás megelőzte a jelenleg elérhető modelleket, amelyek sok szempontból „elég hülyék”.

Ahogy azt nemrég a Telexen részletesen kiveséztük, a múlt tapasztalatai és a jelen realitásai alapján erősen túlzónak tűnnek az ilyen félelmek. Az elérhető modellek ráadásul sokszor tényleg hülyék: rosszabb esetben komoly kárt okoznak egy kitalált botránnyal, jobb esetben meg nem létező emberekről kell vitatkozni velük. Az is simán előfordul, hogy egy cikkgeneráló MI szemléz egy nyilvánvaló kamuposztot a Redditről, amiből jól látszik, hogy önmagában használhatatlan. Legalábbis hiteles újságírásra, forgalomgenerálásra ugyanis már most is tökéletes az automatizált tartalom, ami elég rosszul hangzik.

Glorbo és a World of Warcraft

Ha már felmerült, kezdjük a reddites történettel, mert ez legalább olyan szórakoztató, mint amennyire aggasztó. Az elmúlt hetekben különböző helyeken, például a World of Warcraft subredditen is többször felmerült (például itt és itt), hogy az online videójátékos tornák szervezésével foglalkozó Z League saját, The Portal néven futó híroldala csak MI-modellel szemlézett Reddit-posztokból áll, az emberi input pedig ránézésre a nullához közelít. Ezekből a posztokból röhejes módon született egy MI által generált cikk, hogy a játékosokat aggasztják az MI által generált cikkek, de az igazi dili akkor kezdődött, amikor egy redditező csapdát állított a honlapnak.

A csapda ez a poszt volt, amiben kaefer_kriegerin arról írt, hogy nagyon izgatott, hogy a fejlesztő Blizzard végre beleteszi Glorbót a World of Warcraftba, ami persze várható is volt, hiszen már 1994-ben is utaltak erre a Hearthstone-ban. Mindez jól hangzik, csak éppen semmi értelme: Glorbo nem létezik, a Hearthstone játék 2014-ben jelent meg, és a poszt többi része is teljes kitaláció. A Portalon viszont ettől még megjelent róla egy cikk, benne Glorbóval, az ugyancsak kitalált Klikclac nevű tárggyal, sőt azzal a konkrét idézettel, hogy „nagyon szeretném, ha egy nagy, botok által üzemeltetett hírportál írna erről egy cikket”.

A redditezők csapdájába belesétáló MI sztoriját aztán megírta egy rakás valódi gémerportál is, a World of Warcraft egyik vezető fejlesztője pedig viccesen arról tweetelt, hogy nagyon örül, hogy végre beszélhet Glorbóról, akinek implementálásán már 15 éve dolgoztak. A hiba utóéletére természetesen a Z League-nél is felfigyeltek, a honlapról ugyanis eltűntek az említett cikkek, és azóta nem is születtek új anyagok semmilyen témában, ezen felül viszont nem reagáltak semmit, és a korábbi tartalmak is elérhetők maradtak. Ezeket átpörgetve egyértelmű, hogy nagyrészt tényleg automatizálva ment a tartalomgyártás:

egyrészt mert minden cikk pont ugyanúgy épül fel – rövid bevezető, beágyazott Reddit-poszt/YouTube-videó, legfontosabb dolgok pontokba szedve, részletes összefoglalók pár hozzászólásból, ezekből szedett közcímekkel;
másrészt pedig mert elképzelhetetlen, hogy az amúgy emberi neveket használó szerzők ne robotok legyenek úgy, hogy július 20-án, tehát egy nap alatt a kereső alapján 1006 (!) cikk jelent meg az oldalon, és ebben a törölt anyagok nincsenek is benne.

Azt egyébként hozzá kell tenni, hogy bár az anyagokban gyakran vannak értelmetlen, felesleges, vagy ha egy, direkt a modell átverésére szánt posztból készültek, konkrétan kamu részek, első ránézésre egy csomó cikk tök okénak tűnik. Pláne úgy, hogy egy csomó videójátékokkal foglalkozó portál szintén Reddit-posztok szemlézéséből él, csak alacsonyabb volumennel, a hülyeségek kiszűrése mellett. Annak ellenére pedig, hogy a Portalt író MI-t láthatóan nagyon könnyű lóvá tenni, és emiatt most közröhej tárgya lett, a Z League-nek így is tutira megérte a kaland.

Nem az újságírás a lényeg

Mivel a Z League nem reagált semmilyen megkeresésre, nem lehet pontosan tudni, hogy teljesen automatizált volt-e a tartalomgyártás, ahogy azt sem, hogy ha nem, akkor hányan és mennyit foglalkoztak a honlappal. Ránézésre vannak cikkek, amiket ember írt, a Hamza Bakht nevű szerző például valódinak tűnik, de még ezeknél is nehéz megmondani, hogy mennyiben eredeti a tartalom. Az sem derült ki, hogy pontosan milyen módszerrel szemlézik a videókat és posztokat, de az biztos, hogy egy ilyen tartalmakat előállító modellhez igazából nem kell más, mint egy sima fejlesztői hozzáférés a fizetős ChatGPT Plushoz.

A ChatGPT API-ját, egy tartalmakat összeszedő szkriptet és a végső szöveg megírásához szükséges promptokat felhasználva egy-két hét meló után már lehet is gyártani a cikkeket a végtelenségig anélkül, hogy különösebben foglalkozni kellene velük. Ettől persze nem lesz hirtelen a Portal a legolvasottabb videójátékos hírportál, de nyilván nem is ez a cél, hanem az, hogy áttereljék a forgalmat az anyaoldalra, amelyen az online tornákra lehet jelentkezni. Ez már abból is egyértelműen látszik, hogy minden cikk megnyitásakor rögtön feljön egy hirdetés arról, hogy töltsük le a Z League alkalmazását, de

ennél is fontosabb, hogy az egészet egyfajta keresőoptimalizálásként is fel lehet fogni.

Tavaly áprilisban még arról volt szó, hogy a Google spamként fogja kezelni az MI által generált tartalmakat (és így lejjebb sorolja őket a keresési eredményekben), azóta viszont többször közölte a cég, hogy a „hasznos”, minőségi tartalmakra ez nem vonatkozik, februárban pedig az új irányelveiben is rögzítette ezt. Ez azt jelenti, hogy a Google simán beszívja és megjeleníti a Portalon megjelent cikkeket, és ahogy a Decoder is kiemelte, a SimilarWeb adatai alapján májusról júniusra a duplájára növelte a zleague.gg havi látogatottságát. Egészen pontosan 840 ezerről durván 1,7 millióra, ami elég szép eredmény szinte nulla energiabefektetéssel.

Az egyébként nem meglepő, hogy a Google lazított az MI által generált tartalmakkal kapcsolatos hozzáállásán, és nem is csak azért, mert ő maga is könyékig benne van a technológiában. A NewsGuard nevű, online félretájékoztatást és a hírportálok hitelességét vizsgáló cég júniusi jelentésében azt írta, hogy a Google konkrétan profitál is az ilyen, szinte kizárólag MI-alapú tartalmakat közzétevő oldalakból azzal, hogy a Google Adsen keresztül telepakolja automatikus hirdetésekkel a cikkeiket. A NewsGuard szerint ilyen módon nagy, ismert cégek hirdetései is bekerülnek ezekre az oldalakra, vagyis nagybankok, luxusüzletláncok és vezető sportmárkák finanszírozzák az MI által írt hírek terjedését, miközben akaratlanul rombolják a saját imázsukat.

A tartalomgyárak új generációja

A NewsGuard hónapok óta rendszeresen foglalkozik az úgynevezett UAIN-ekkel (Unreliable AI-Generated News and information websites, magyarul megbízhatatlan, MI által generált hír- és információs portálok), amelyekből a legfrissebb adatok alapján 365-öt tartanak nyilván. A definíciójuk szerint ezen olyan honlapokat kell érteni, amelyek minimális, vagy semmilyen emberi felügyelet mellett működnek, és nagyrészt botok által írt cikkeket tesznek közzé, de a kritériumok között szerepel az is, hogy megjelenésükben és nevükben hasonlítanak egy valódi hírportálra, és nem teszik egyértelművé, hogy MI-t használnak.

Ez utóbbi önmagában is forró téma volt az elmúlt hónapokban, egyrészt mert több nagy lap is elkezdte kihasználni a technológiát, az Axel Springer vezetője pedig arról beszélt, hogy a mesterséges intelligencia akár az újságírók állását is veszélyeztetheti, másrészt pedig mert a CNET például jókora botrányba keveredett, miután kiderült, hogy novemberben elkezdett mesterséges intelligenciát használni bizonyos cikkek megírásához, de erről nem szólt senkinek. A dolog végül januárban derült ki, és hamar egyértelmű lett, hogy az anyagok amellett, hogy nem túl etikusan születtek meg, amúgy hemzsegnek a hibáktól is, ami nem a legjobb, ha például pénzügyi tanácsadásról van szó.

Azóta a CNET alkalmazottai szakszervezetet alapítottak, a portál pedig nemrég teljesen átdolgozta az MI által generált tartalmakra vonatkozó irányelveit.

Az tehát jól látszik, hogy már önmagában ez is fontos problémákat vet fel, az UAIN-eknél viszont ez csak az egyik összetevő a négyből. Persze az olyan esetekben, mint a Z League saját „hírportálja”, nagy károkat nehéz lenne okozni, elvégre a hírek arról szólnak, hogy mit gondolnak a redditezők arról, hogy nem lesz szó a StarCraftról a következő BlizzConon, de az egy fokkal rosszabb, ha politikáról vagy közéletről kamuzik egy MI egy valódinak tűnő oldalon. Ráadásul itt is előkerül az a gyakran emlegetett kérdés, hogy mi lesz, ha például a ChatGPT vagy a Bing elkezdenek ezekből a láthatóan egyre növekvő elérésű kamuforrásokból dolgozni.

Emiatt az egész úgy is aggályos lehet, ha az emberek felismerik, hogy amit látnak, azt egy MI generálta, ami egyébként a NewsGuard májusi jelentése alapján egyelőre egyáltalán nem nehéz. A NewsGuard az akkor még csak 49 azonosított oldal közül 29-et ért el, közülük ketten megerősítették, hogy MI-t használnak, ketten állították, hogy ilyesmiről szó sincs, a többieknél pedig vagy rossz volt a megadott emailcím, vagy nem válaszoltak semmit. Minden oldalon feltűnt ugyanakkor legalább egy cikkben egy tipikusan generált szövegekben megjelenő hibaüzenet. A CountyLocalNews.com-on egészen konkrétan az volt az egyik hír címe, hogy

Halálhír: Sajnos ezt a promptot nem tudom teljesíteni, mert szembemegy az etikai és morális elvekkel. A vakcinagenocídium egy tudományos alapokat nélkülöző összeesküvés-elmélet, amely káros lehet a közegészségre. MI-modellként felelősségem tényszerű és megbízható információkat közölni.

A legtöbb oldal többnyire nagyobb híroldalak cikkeit foglalja össze MI-modellekkel, de időnként olyan félrevezető cikekek is megjelennek, mint egy azóta már törölt cikk a celebritiesdeaths.com-on, ami alapján Joe Biden amerikai elnök álmában elhunyt április 2-án. Az elsődleges cél a naponta több száz, vagy akár ezer közzétett cikkel, hogy pénzt keressenek az automatikusan elhelyezett reklámokkal, vagyis az egész nagyon hasonlít a korai internet tartalomgyáraihoz, ahol emberek csinálták ugyanezt, csak ez sokkal jobban skálázható és még kevesebbe kerül. Ha pedig nem csapnak le rájuk, a modellek fejlődésével és némi plusz energiabefektetéssel a jövőben sokkal hatékonyabbak, és ami még fontosabb, hitelesebbek lehetnek majd.

Kedvenceink

Partnereinktől

Kövess minket Facebookon is!