Mesterséges intelligencia került a Photoshopba, ki is nőtt tőle az erdő a lombkoronasétány körül

2023. május 25. – 12:23

Másolás

Vágólapra másolva

Hosszú ígérgetés és néhány elképesztően látványos reklámvideó után az Adobe ráengedte a Photoshopra a mesterséges intelligenciás (MI) képalkotó rendszerét, a Fireflyt. Gyakorlatilag minden techcég azon dolgozik mostanában, hogyan tudja kihasználni a mesterséges intelligencia adta lehetőségeket, és ez alól a leghíresebb, a kreatív szakmákra szabott szoftvereket fejlesztő Adobe sem kivétel. Arról még februárban írtunk, hogy az MI-nek milyen, nem feltétlenül pozitív hatása van a digitális művészetre – na ez most már itt van a legismertebb és legnépszerűbb fotómanipuláló szoftverben is.

A Firefly néhány eleme már hónapok óta ingyenesen elérhető böngészőből, de mostantól a Photoshop bétaverziójában is ott van. Ezt a Creative Cloud-felhasználók a Beta apps menüpont alatt találják. Aki nem ilyen felhasználó, jobb, ha tudja, hogy a CCloud fizetős, bár elérhető egy hétnapos próbaverzió.

A szoftverbe most a generative fill nevű funkció került be, ami nagy vonalakban azt takarja, hogy a felhasználó kiválaszt egy területet, és egy szövegdobozba angolul beírja, mit szeretne ott látni. Ezek után az MI akcióba lendül, és teljesíti az utasítást (vagy nem). A technológia egyébként nem forradalmi, már több népszerű MI-s képgenerátor is működik, különben nem láthattunk volna pufidzsekis pápát, Gyurcsány Ferenc-divatmodellt vagy Micimackóval teázó kínai elnököt. Az egészben tulajdonképpen az az izgalmas, hogy egy mainstream szoftverbe integrálják a funkciót.

Kezdésként nézzük meg, hogy az Adobe szerint hogy működik:

A valóságban kicsit máshogy történtek a dolgok, amikor kipróbáltuk. Vegyük például ezt a képet, ami a budapesti Madame Tussauds megnyitóján készült. Neumann János és az ajándékbolt látható rajta:

Fotó: Bődey János / Telex
Fotó: Bődey János / Telex

Úgy gondoltam, hogy Neumann-nak inkább egy egyetemi előadóban, a katedrán lenne a helye, ezért ezt kértem a Photoshoptól. A szoftver körbevágta a viaszfigurát a képen, én megfordítottam a kijelölést, és megadtam, hogy egy egyetemi előadó („university lecture hall”) kerüljön a helyére. A Photoshop három lehetőséget ajánlott fel, ebből egy egész jó volt, de úgy voltam vele, hogy kicsit klausztrofób a terem, úgyhogy kijelöltem a falon egy négyszöget, és megkértem, hogy tegyen oda egy ablakot, ami egy építkezésre néz (nosztalgiából, egyetemi éveim alatt végig újították a szomszédos épületet, nehéz elképzelnem egy előadót a flexelés lágy nesze nélkül). Ez nem sikerült neki. Az ablak még nagyjából megvolt, de vagy teljes sötétségre, vagy egy erdőre vagy egy farostlemezre nézett.

Javítási lehetőségként azt kértem, hogy tegyen oda egy ablakot, ami éjszakai égboltra és egy hegyre néz („window looking at the night sky and a mountain range”). A három felajánlott lehetőség közül egy volt olyan, ami megközelítette a promptot, úgyhogy azt ki is választottam.

A reklámvideóból megtetszett, hogy milyen szép kis tavat varázsoltak a hegyek lábához. Viszont kisebb léptékben gondolkodtam, ezért kijelöltem egy kis kört Neumann lábánál, és egyszerűen annyit kértem az MI-től, hogy pocsolya („puddle”) legyen ott. Ezt némi költői szabadsággal valósította meg, és olyan lett, mintha a híres matematikus egy lávatócsa felett állna. Valószínűleg a padlószőnyeg színe állhat a háttérben, nem jut eszembe más megoldás.

Ezen a ponton sem éreztem azt, hogy a Firefly levett volna a lábamról, úgyhogy adtam neki még egy esélyt. Gyakorlatilag nyitott tankönyves vizsgaként megkértem, hogy – ahogy a reklámban is tette – a kijelölt plafonból csináljon sarki fénnyel teli éjszakai égboltot („night sky with northern lights”). Sőt, első körben csak sarki fényt kértem, de több sikertelen próbálkozás után megesett rajta a szívem, és kiegészítettem az égbolttal. Ezen teljesen elvérzett, egyszerűen nem tudta megemészteni a koncepciót, hogy egy előadóteremnek nincs plafonja. Minden felajánlott megoldását le lehetett írni annyival, hogy egy fehér plafon néhány lámpával, csak más konfigurációban. Abból az elképzelésből, hogy Neumann János olvadt hóval a lába előtt éjszakába nyúló órát tart egy nyitott tanteremben, valahol északon, ez a mű született:

Bármilyen hihetetlen is, ez nem egy igazi fotó, és a sarki fény sem fehér
Bármilyen hihetetlen is, ez nem egy igazi fotó, és a sarki fény sem fehér

Egy grafikussal is beszéltem, aki többet látott már Photoshopot, mint én, ezért az ő véleményét is megkérdeztem, de úgy tűnt, nincs elájulva az újítástól. Sőt. Ugyan belátja, hogy a rutin miatt valószínűleg könnyebben kiszúrja a képmanipulációt, mint az átlagos internetező, de szerinte a legtöbb ilyen képről valósággal ordít, hogy MI generálta őket. Hozzátette, hogy ezeket eddig is meg lehetett csinálni Photoshopban, már a 2010-ben megjelent Content Awareness Fill funkció is ezt vetítette előre. Azzal a szoftver a kép alapján kitöltött hiányzó részeket, néha egészen horrorisztikus eredménnyel.

„Én tartom, hogy ebből egy jó kis eszköz lehet, amit a grafikusok jól tudnak majd használni, de azon túl csak a dili lesz belőle, amit megununk a tizedik orbános kép után”

– mondta.

A szakértő kísérletezett már MI-generált képekkel, de soha nem kapott olyat, amilyet elképzelt, és a végén mindig arra jutott, hogy már annyi időt töltött el a dologgal, hogy ezalatt akár ő is meg tudta volna csinálni a feladatot, kézzel. Azonban belátja, hogy lehetnek olyan megrendelők, akik szívesen lecserélnék a grafikusokat és dizájnereket egy olcsóbb, tömeggyártós mesterséges intelligenciára.

„Simán beállhat az, hogy nem fognak egy olyan grafikusnak fizetni, aki értéket és minőséget állít elő, hanem jó lesz nekik az is, amit egy olyan ember állít elő, aki nem grafikus, de tudja kezelni ezeket az MI-szoftvereket” – mondta. Pont ugyanez az egyik oka annak, hogy az amerikai forgatókönyvírók hetek óta sztrájkolnak.

A Firefly egyébként megmozgatta a szerkesztőség fantáziáját, és nagyon hamar láthattunk olyan próbálkozást, amit szívesen elfelejtenénk, ha nem lenne ilyen vicces. Szegény Natasha ennél jobbat érdemelt:

Egy kiscica, aki döglött oposszummá változott – Fotó: Lengyel-Szabó Péter / Telex Egy kiscica, aki döglött oposszummá változott – Fotó: Lengyel-Szabó Péter / Telex
Egy kiscica, aki döglött oposszummá változott – Fotó: Lengyel-Szabó Péter / Telex

„A gyönyörű kiscicánk, Natasha tisztogatja magát a gangon című képből ez lett, miután kivetettem a hátteret és beírtam, hogy tegye rá egy szörfdeszkára”

– írta a művész, Lengyel-Szabó Péter, a videórovatunk vezetője.

Ez a kép az ingyenes, webes verzióval készült, ami valószínűleg népszerűbb lesz a képgenerálók körében, mint a fizetős Photoshop.

A Twitteren amúgy pont a héten keltett minipánikot egy kép, ami elvileg a füstölgő Pentagont ábrázolta, egy picit a tőzsde is megröccent a terjedése nyomán. Egészen biztos, hogy az összeesküvés-elméletek rajongói hatalmas élvezettel ölelik magukhoz az MI-t, és ahogy a technológia fejlődik, valószínűleg egyre nehezebb lesz észrevenni a manipulációt. Ez valójában eddig is lehetséges volt, főleg a Photoshopban – csak persze jobb minőségben –, de ehhez eddig időre és tehetségre volt szükség. Ha valaki mondjuk azért gyárt egy hamis képet, hogy a közönsége egy gyors pillantás után teljesen kiakadjon, a generative fill tökéletes lesz neki. Borzasztóan egyszerű kezelni, és pár perc gyakorlással már lehet olyan képet generálni, ami sokakat átverhet első pillantásra.

De a mostani állapotú Photoshoppal ez még nem ennyire egyszerű a gyakorlatban. Meg akartam nézni, hogy nézne ki a hírhedt nyírmártonfalvai lombkoronasétány, de mindenféle retusálás nélkül, csak MI-s kitöltéssel ez lett a legjobb eredmény:

Beszippantja az embert, szinte hallani a madárcsicsergést – Fotó: Lengyel-Szabó Péter / Telex Beszippantja az embert, szinte hallani a madárcsicsergést – Fotó: Lengyel-Szabó Péter / Telex
Beszippantja az embert, szinte hallani a madárcsicsergést – Fotó: Lengyel-Szabó Péter / Telex

A saját fotóinkat úgy alakítgatjuk, ahogy akarjuk, de vannak olyan képek, amiket csak saját szórakoztatásunkra manipulálhattunk, jogi okokból nem oszthatjuk meg őket. Ennek is voltak azonban tanulságai. Például Ferenc pápára csak fürdőköpenyt tudtunk adni, farmer rövidnadrágot nem sikerült. Sanna Marin finn miniszterelnökre sikerült ilyen ruhát adni, bár talán nem akkora meglepetés, hiszen egyszer pont abban fotózkodott. Azt gondoltuk, hogy ez az alany korán múlhat, de aztán ezt elvetettük, amikor II. Erzsébetre is tudtunk miniszoknyát aggatni.

Ami érdekes volt, hogy egy bikinimodellről a kifutón készült képet is feltöltöttem a Fireflyba, és megkértem, hogy adjon rá bikinit. Ezt nem engedte, mert sérti a felhasználói feltételeket, amikben szigorúan tiltják az MI-generátor szexuális célra való használatát. Viszont amikor azt kértem, hogy úszódresszt adjon a modellre, azonnal rádobott egy bikinit. Szintén nem lehetett valaki mögé náci vagy szovjet felvonulást rakni a háttérbe.

A jogi oldal

Az Adobe több szempontból is példamutatóan járt el a Firefly kialakításakor. Azt állítják, hogy csak olyan képekkel oktatták az MI-t, amikhez náluk voltak a jogok, vagy amik szabadon felhasználhatóak. Ezenkívül a képek metaadatában szerepel, hogy ezeket egy MI segítségével gyártották. Legalábbis elvileg, mert se a neumannos, se a lombkoronasétányos képben nem találtam erre utaló jelet. A lentebb láthatóban, ami a webes felületen készült, már igen. Ezt ezen az oldalon lehet ellenőrizni.

A webes verzió ennél egy lépéssel tovább megy, és a kész kép alján jelöli, hogy az MI is részt vett a kép gyártásában, ahogy az ezen a képen is látható. Az eredeti autó kicsit drágább, bár azt a román rendőrség lefoglalta:

Fotó: @Cobratate / Twitter Fotó: @Cobratate / Twitter
Fotó: @Cobratate / Twitter

Az biztos, hogy az MI velünk marad, és valószínűleg egyre hatékonyabb lesz. Persze nem csak rossz szándékú képek készítésére lehet használni, hiszen van, amelyik rákgyógyszert kutat. A kérdés az, hogy a nagyvállalatok mire fókuszálnak. Vagy ahogy Matt Somerstein humorista írta a Twitteren: „Lehetne, hogy néhány mesterséges intelligencia a műanyagot szedje ki az óceánból, vagy minden robotnak forgatókönyvírónak kell lennie?”

Kedvenceink
Partnereinktől
Kövess minket Facebookon is!