Most már bárki kipróbálhatja a mesterséges intelligenciával felturbózott Binget

2023. május 5. – 17:18

Másolás

Vágólapra másolva

2023 kétségtelenül a mesterséges intelligencia, azon belül is a nagy nyelvi modellek éve, ezt a hullámot pedig eddig a Microsoftnál talán senki sem lovagolta meg jobban. A cég februárban mutatta be az MI-vel felturbózott Binget, aztán bő egy hónappal később azt is megvillantotta, hogy mire lehet számítani a jövőben az ezt (is) hajtó GPT-4 nevű modelltől. Most az is kiderült, hogy konkrétan a Bing számára mit hordoz a jövő, és bár nagy meglepetések az eddigiek fényében nem voltak, önmagában azért is érdemes végigszaladni ezeken, mert a Microsoft mindenki számára elérhetővé tette a keresőmotor MI-s funkcióit.

Ezt, illetve az újdonságokat egy elég rövid videóban jelentette be csütörtökön a cég, New Yorkban azonban egy sajtóeseményt is tartottak, ahol többek közt a videóban is megszólaló Yusuf Mehdi mutatta be a nyaktörő tempóban ledarált újdonságokat kicsit részletesebben. Ennek pedig abszolút volt is értelme, mert volt itt szó mindenről az asztalt foglaló Bingtől a keresési előzményeken át a különféle vizuális elemeket sokkal jobban integráló válaszokig, és az Edge korábban belengetett ráncfelvarrásáról is esett némi szó a Tech Crunch beszámolója alapján.

A leglátványosabb változás nyilvánvalóan az lesz, hogy a binges chatbot egyre gyakrabban fog képekkel reagálni, legalábbis amikor annak van értelme. Ezt az újdonságokról szóló, részletes blogposzthoz hasonlóan azzal demonstrálták, hogy megkérdezték a Bingtől, hogy az oszlopkaktusz virágzik-e, amire nemcsak szöveges válasz érkezett, hanem egy képet is mellékelt a chatbot a kaktuszról. Az egyelőre nem derült ki, hogy pontosan milyen esetekben mellékel majd képet is a chatbot, de arra már most érkezett ígéret, hogy a már létező szűrők gondoskodnak majd arról, hogy ne jelenjenek meg a nyugalom megzavarására alkalmas képek.

Azt persze itt rögtön ki kell emelni, hogy a Bing a megjelenése után az összes szűrő ellenére is produkált furcsa dolgokat, a Microsoft pedig ugyan elkötelezett a felelős MI-irányelvei mellett, két hónapja az ottani leépítések keretében elküldte a korábbi átszervezéssel egyébként is szinte nullára redukált, etikus MI-vel foglalkozó csapatát is. Sarah Bird, aki a felelős MI-ért felel a cégnél, a Tech Crunch újságírójának azt mondta, dedikált csapat nélkül is számottevő eredményeket értek el a Bing kihasználásának megakadályozásában, és a szűrők mellett emberi moderátorok is dolgoznak azon, hogy ne használják fel például adathalász emailek generálására a chatbotot.

A vizualitásra visszatérve a Microsoft a képek mellett különféle grafikonokat is beígért, amelyek tovább segíthetik a válaszok megértését, és arról is szó esett, hogy a GPT-4 multimodalitását kihasználva a Bing chatbotja képes lesz majd arra, hogy ne csak szöveget, hanem képeket is képes legyen értelmezni, és ez alapján válaszokat adni, mobilon pedig így fog tudni megválaszolni kérdéseket a Bing az éppen megnyitott honlapról. A nemrég az Edge-be is integrált, DALL-E 2-n alapuló képgenerátorról is beszéltek, amellyel a továbbiakban már nemcsak angolul, hanem a Bing által kezelt összes nyelven lehet majd kommunikálni.

Ahhoz képest egyébként, hogy mekkora felzúdulást váltottak ki a képeket generáló MI alapú modellek, a binges képgenerátorról viszonylag kevés szó esett eddig, pedig ehhez a nemrég erősen leszabályozott Midjourney-vel ellentétben még Discordra sem kell regisztrálni, és egyelőre az ingyenes napi limit is elég megengedő. Arra egyelőre a Microsoft sem adott konkrét választ, hogy hogy lehetne feloldani a digitális művészek és az MI alapú modelleket fejlesztő cégek közti ellentétet, de Bird azt elismerte, hogy előbb-utóbb meg kell majd oldani ezt a problémát.

Arra is lesz majd lehetőség, hogy visszanézzük a korábbi beszélgetéseinket, sőt, újra felvegyük a fonalat ezekben, és exportálni is lehet majd ezeknek a tartalmát, bár ennek a mindendre kiterjedő verziójára egyelőre még várni kell. Hasonlóan korai fázisban vannak még a Bingbe érkező pluginek, amelyekkel a chatbot például asztalt foglalhat majd a kedvenc éttermünkbe, vagy éppen képes lehet megoldani egy komplex matematikai problémát a ChatGPT Plusba nemrég integrált Wolfram Alpha segítségével. A ChatGPT azért is jó párhuzam, mert a Bingbe alighanem hasonlóan érkeznek majd meg a pluginek, mint abba, de konkrétumok egyelőre nem hangzottak el.

Végezetül pedig az Edge februárban csak belengetett átalakításáról is esett némi szó, melynek keretében nemcsak a már meglévő Bing-integráció funkciói – például a dokumentumok vagy a honlapok tartalmának összefoglalása – lesznek jobbak, hanem érkeznek az automatizációs akciók is. Ezeket használva például csak annyit kell mondanunk majd a Bingnek, hogy meg akarunk nézni egy akciófilmet, és rögtön kilistáz nekünk párat, aztán ha választottunk, felsorolja, hogy ezt hol tudjuk megnézni, és a végén csak választanunk kell egy platformot, ahova rögtön el is navigál minket.

Hogy ez az egész törekvés hova fog kifutni, és elképzelhető-e például az, hogy szép lassan az egész microsoftos ökoszisztéma integrálódjon az Edge-be – amire az eddig látottak alapján minden esély megvan – arról valószínűleg a májusban esedékes fejlesztői konferencián, a Microsoft Builden tudhatunk majd meg bővebb infókat. A Telexen egyébként nemrég készítettünk interjút Szabó Péterrel, a magyar Microsoft ügyvezető igazgatójával nyelvi modellekről, a technológia fejlődéséről és a Microsoft ebben játszott szerepéről és felelősségéről, ezt ide kattintva lehet elolvasni.

Kedvenceink
Partnereinktől
Kövess minket Facebookon is!