Új gépi tanulásos módszert fejlesztettek ki az ELTE kutatói az emberi agy kapcsolatainak leírásait felhasználva

2022. március 8. – 11:12

Egy új módszert fejlesztettek ki az ELTE kutatói, amivel hatékonyabbá tehetik a gépi tanulást – írták kedden a Telexnek egy közleményben. A kutatásukhoz az emberi agy kapcsolatainak leírását használták fel, hogy teszteljék a módszert, amit végül Newton-elmosásnak neveztek el. A Scientific Reports című szaklapban megjelent tanulmányukat itt elolvashatja.

Ahhoz, hogy egy mesterséges intelligenciát (MI) megtanítsanak bizonyos dolgokra, a fejlesztőknek rengeteg példát kell megmutatniuk a rendszernek, hogy felismerje a sajátosságaikat. Így tanítják meg például Sirinek vagy Alexának, hogy a virtuális asszisztensek megértsék, mit mond nekik az ember. Ez nagy vonalakban úgy néz ki, hogy meghallgattatnak velük egy csomó emberi beszédet, hogy megértsék a felhasználók mondatait.

Azonban nem mindig áll a kutatók rendelkezésére ilyen nagy méretű adathalmaz, emiatt sokszor adatsokszorozást használnak: minimális változtatásokat hajtanak végre az egyes adatokon, hogy azok önálló adatoknak tűnjenek, így át tudják verni az MI-t a tanulási hatékonyság csökkentése nélkül.

Önvezető autókat például tanítják, a Gauss-homályosítást használva a közlekedési szituációkat leíró képek egy-egy – többnyire nem lényeges részét – elhomályosítják, elmossák, és így egyetlen eredetiből sok képet tudnak kreálni.

Ez az eljárás azonban biológiai, kémiai szerkezetekkel és képletekkel nem működik, az ELTE Matematikai Intézete PIT Bioinformatikai Csoportjának kutatói – Keresztes László, Szögi Evelin, és Varga Bálint Grolmusz Vince professzor vezetésével – ezért dolgoztak ki egy új módszert, a Newton-elmosást.

Ezzel az adatok javítási mechanizmusán variálnak. A Newton-elmosás során többször számolnak ki valamilyen mennyiséget, és ezeket átlagolva használják. Ez a gyakorlatban úgy néz ki, hogy a 10 mérésből kiválasztanak hetet, méghozzá minden lehetséges módon (pl. első, második, harmadik, negyedik, ötödik, hatodik hetedik, vagy első, harmadik, negyedik, ötödik, hatodik hetedik, nyolcadik, stb.), és ezeket külön-külön átlagolják. Így az adathalmaz megsokszorozható, ebben az esetben ahányszor 10 adatból 7-et ki lehet választani, a példában ez éppen 120. A közlemény szerint ez a módszer jobb minőségű adatokat eredményez, mert nem egy mérésen alapszik, hanem hét átlagán.

A kutatók a módszert először az emberi agy kapcsolatait leíró 1053 alanytól származó agygráfokra alkalmazták, és így az adathalmaz méretét százhúszszorosára növelték, azaz 126 360 agygráfot készítettek. Ezt még megötszörözték, mert minden agygráfot öt különböző felbontásban számoltak ki, így 631 800 agygráfot tettek közzé. Ezeknek kiszámítása nagyjából három hétig tartott, 36 számítógép dolgozott rajta. A Newton-elmosást sok téren lehet használni, például kémiai és biológiai adathalmazokon.