2022. június 19. – 07:00
Ha valaki az utóbbi hetekben felment az internetre, néhány dolog szinte biztos, hogy szembejött vele. Ilyen volt például a magyar futballválogatott 4–0-s győzelme az angolok ellen, de kicsit absztraktabb vizekre evezve az is, hogy hirtelen mindenhol furcsa montázsok kezdtek el feltűnni, melyek a lehető legkülönbözőbb dolgokat ábrázolták a halszemoptikával lefotózott, gördeszkázó pápától egészen a pizzát evő Venomig. Ez persze önmagában nem lenne túl különleges, néhány digitális művész valószínűleg ennél sokkal furcsább dolgokat is szokott alkotni,
de ezeket a képeket nem egy ember alkotta meg, hanem egy mesterséges intelligencia (MI), aminek néhány másodperc alatt tényleg szó szerint mindenre van válasza.
Ez a mesterséges intelligencia a DALL-E Mini névre hallgat, és egy Boris Dayma nevű programozó alkotta meg 2021 nyarán a Google és a Hugging Face nevű, a mesterséges intelligencia fejlesztésére és demokratizálására törekvő közösség versenyére. Dayma az i nevű lapnak elmondta, egy hónapot dolgozott a modellen, a végére pedig örült, hogy egyáltalán működik, de így is sokan érdeklődtek iránta, ami a körülményeket figyelembe véve mondjuk nem is volt meglepő.
Az olyan MI-modellek, mint a Google Imagen vagy éppen az OpenAI tavaly kiadott, majd idén továbbfejlesztett DALL-E-je (ami nyilvánvalóan inspirálta a DALL-E Minit, de hivatalosan nincs hozzájuk semmi köze) tényleg lenyűgöző képeket tudnak generálni, de csak pár ezren férnek hozzájuk. Dayma viszont olyasvalamit alkotott, amit ezen a linken akárki szabadon tud használni, akár még telefonról is. A programozó elmondása szerint ez elég fontos szempont, az ehhez hasonló mesterséges intelligenciák esetében ugyanis egyelőre a legjobban sikerült képek kerülnek a nyilvánosság elé. Egy ilyen demó viszont jól megmutatja, hogy pontosan mire képes egy ilyen modell, mikben jó, és hol tudna még javulni.
Ahhoz egyébként nem is kell túl sokat nyomkodni a DALL-E Minit, hogy kiderüljenek a hiányosságai. Ahogy azt Dayma is elmondta az i-nak, a tájképekben, a csendéletekben és az absztraktabb képekben elég jó a mesterséges intelligencia, az embereknél viszont már nehezebb dolga van. Ez persze nem is meglepő, sokkal furcsább egy elcsúszott szem, eltorzult száj vagy amorf emberi alak, mint egy furcsa avokádó, egy rosszul ábrázolt fa vagy egy kicsit absztraktabb absztrakt festmény. Utóbbiakat látva az ember azt fogja gondolni, hogy ez egész jól néz ki, az előbbiek pedig a rémálmaiban fogják kísérteni hetekig. Példának okáért itt van Joe Biden amerikai elnök a méltán híres, Neon Genesis Evangelion című animében.
Oké, persze, mindegyik képen az szerepel, aminek kell (bár azt elsőre nehéz eldönteni, hogy Shinji, Rei vagy esetleg egy kettejükből összemontírozott torzszülött áll Biden mellett), de aligha jutna eszébe erről bárkinek, hogy a mesterséges intelligencia holnap le fogja igázni az embereket. Persze a DALL-E Mininek nem is ez a lényege: eleve egy limitált modellről van szó, melynek inkább célja a technológia demokratizálása, mint az, hogy a lehető legtökéletesebb képeket alkossa meg.
Dayma azt ugyanakkor már két hete leszögezte, hogy az MI még mindig tanul, és fejlődni is fog. Méghozzá olyan ütemben, hogy egy hét alatt már szabad szemmel is észre lehessen venni. A címben szereplő, tárgyaláson ülő Godzillát itt, a kosárlabdázó demogorgont pedig itt találják, ha pedig ez nem volt elég, ide kattintva egy rakás képet böngészhetnek végig.
A DALL-E Minivel, illetve az ehhez hasonló mesterséges intelligenciákkal hamarosan nagyobb cikkben is foglalkozunk majd.