Érvelő, logikát használó mesterséges intelligenciát fejleszt az OpenAI

2024. július 17. – 12:06

Másolás

Vágólapra másolva

Névtelen forrásokra és a lap számára elérhető dokumentumokra hivatkozva számolt be a Reuters arról, hogy a ChatGPT „atyja”, az OpenAI új, érvelni és logikát használni is képes mesterséges intelligenciát fejleszt. Az MI kódneve jelenleg Strawberry, de korábbi dokumentumokban Q-ként hivatkoztak rá. Azt, hogy pontosan hogyan működik a technológia, még az OpenAI-on belül is titokban tartják.

A Reuters által átvizsgált dokumentum egy olyan projektről szól, ami Strawberry-modelleket használ ahhoz, hogy az OpenAI mesterséges intelligenciája ne csak válaszokat generáljon a különböző promptokra, hanem képes legyen előre is tervezni, és autonóm módon és megbízhatóan navigáljon az interneten. Az OpenAI ezt „mélykutatásnak” nevezi.

Az OpenAI szóvivője a Reutersnek azt mondta: „azt akarjuk, hogy MI-modelljeink úgy lássák és értsék a világot, mint mi. Az új MI-képességek folyamatos kutatása bevett gyakorlat az iparágban, és az a közös meggyőződés, hogy ezek a rendszerek idővel jobban tudnak majd érvelni”. A Strawberryről a szóvivő nem válaszolt a lapnak.

A Reuters már tavaly beszámolt a projektről, ami akkor még Q néven futott az OpenAI-n belül, ekkor már azt lehetett hallani, hogy a modellek képesek megválaszolni trükkösebb tudományos és matematikai kérdéseket. Ezt a mai, széles körűen elérhető modellek még nem tudják. A Reutersnek egy másik forrás azt mondta: az OpenAI belsőleg tesztelt egy olyan MI-t, amely több mint 90 százalékot ért el a MATH adatsoron, ami egy matematikai feladatokat tartalmazó adatcsomag, és arra használják, hogy MI-modelleket tanítsanak vele matematikai levezetések és magyarázatok generálására. Kedden egy belső meetingen az OpenAI bemutatott egy olyan kutatási modellt, amelyről azt állította, hogy új, emberszerű érvelési képességekkel rendelkezik. A Reuters ezekről nem tudta megállapítani, hogy valóban a Strawberryről van-e szó.

A lapnak nyilatkozó szakértők szerint az érvelés kulcsfontosságú az emberi vagy az azt meghaladó szintű mesterséges intelligencia eléréséhez. A nagy nyelvi modellek ma már gyorsan képesek nagyobb mennyiségű szövegek összefoglalására és gyors szövegírásra, a technológia viszont képtelen „használni a józan eszét” olyan problémák esetében, amik az ember számára megérzésen alapulhatnak, például a logikai tévedések felismerésénél. Amikor egy most elérhető modell ilyen jellegű problémával találkozik, ugyan megpróbálja őket megoldani, de rendszerint kevés sikerrel jár.

A Reuters által megkérdezett MI-szakértők szerint az MI kontextusában az érvelés képessége egy olyan modell kialakítását jelenti, amely lehetővé teszi, hogy a rendszer előre tervezzen, ismerje a fizikai világ működését, és megbízhatóan kezelje a többlépcsős problémákat. Az MI-modellek érvelésének javítása a kulcsa annak, hogy sokkal több mindenre tudjuk őket használni, a tudományos kutatásoktól kezdve az új szoftverek tervezéséig és kifejlesztéséig.

Az OpenAI-n kívül más nagy cégek, például a Google, a Meta és a Microsoft is kísérleteznek különböző technikákkal az MI-modellek érvelési képességeinek javítására, és az MI-kutatásokat végző tudományos laborok nagy része is vizsgálja ezeket a lehetőségeket. A szakértők között megoszlanak a vélemények, vannak, akik úgy gondolják, hogy a nagy nyelvi modellek nem lesznek képesek a hosszú távú tervezést beépíteni a működésükbe – ehhez a csoporthoz tartozik például a modern mesterséges intelligencia egyik úttörője, Yann LeCun is, akiről legutóbb Elon Muskkal való csörtéje miatt írtunk.

A Reuters által átnézett dokumentumokban az nincs leírva, hogy a Strawberry hogyan fogja elérni ezt a magasabb szintű érvelést, egy szakértő viszont azt mondta a lapnak, hogy köze lesz egy bizonyos „poszt-tanításhoz”, ami a hagyományos, jelenleg is használt, általános adatok betáplálásán alapuló MI-tréning után jönne. Ez hasonlítana a most ismert finomhangoláshoz, vagyis az olyan folyamatokhoz, amit a mai MI-k is használnak például akkor, ha a felhasználók visszajelzéseket küldenek a modell válaszairól.

Egyelőre nem tudni tehát túl sokat a Strawberryről, csak azt, hogy készül, és valószínűleg megpróbálja majd megugrani az érvelési küszöböt – azt, hogy ez sikerülni fog-e az OpenAI-nak, egyelőre nem lehet megjósolni.

Kedvenceink
Partnereinktől
Kövess minket Facebookon is!