Tütüben kutyát sétáltató jégcsapretek – szürreális képeket alkot egy mesterséges intelligencia
2021. január 7. – 12:25
Ahogy a szürrealistáknál egy varrógép és egy esernyő összetalálkozhatott egy boncasztalon, úgy a Dall-E-re (Salvador Dalira utalva) keresztelt mesterséges intelligencia is képes műalkotásain mindent összeműteni mindennel.
A Dall-E-t arra képezték ki, hogy rövid szöveges leírások alapján kreáljon képeket. A saját műveihez 12 milliárd netre feltöltött képet és a hozzájuk kapcsolódó leírásokat használ fel, írta a mesterséges intelligencia (AI) megalkotója, az OpenAI. A fejlesztők szerint Dall-E elég kreatív, képes tárgyak és állatok antropomorf (emberi) formában való ábrázolására, és egymáshoz nem kapcsolódó fogalmakat is ügyesen összekombinál. Így a bemutatott képeken láthatunk tütüben kutyát sétáltató jégcsapretket, vagy avokádót formájú fotelt is. (Az OpenAI oldalán be is mutat pár példát, hogy a kulcsszavak megadásával milyen eredmény születik.)
Kutatók véleménye szerint a mesterséges intelligencia akkor lesz még intelligensebb, ha képes képeket és szövegeket értelmezni, illetve ezeket ötvözni. A Dall-E pedig efelé egy biztató lépés.
Azt a fejlesztők is elismerték, hogy nem működik teljesen tökéletesen a Dall-E, a képalkotás még nagy mértékben befolyásolja, hogy milyen a szöveges leírás. Ahogy szaporodnak a fogalmak, úgy lesz egyre gyatrább az eredmény. A felhasználók megadhatnak formát, színeket és dizájnelemeket is a képhez
Mark Riedl AI-kutató is talált hibákat a működésben, úgy találta, hogy a Dall-E sok esetben inkább másol, mint alkot, mert ha Google-be ütünk be kulcsszavakat, elég hasonló képeket lehet találni.
(via BBC)