Még ma is frissül a magyar internet 45 éves, lyukkártyákkal indult ősprojektje

2021. február 21. – 07:09

Másolás

Vágólapra másolva

Mikoron a picsek nyárba csak éneklésbe múlatná el dolgát, a hangya igen arat vala búzát hordván az ő fekvésébe. Azon közbe el közelgete a hideg tél is, és meg éhilvén kezde a hangyának könyergeni, hogy enni valót adna. És a hangya ez választ tevé neki, hogy mikoron az picsök éneklött volna, akkoron ő munkálódott volna.

A fenti tanmesét jól ismerjük a tücsökről (itt picsek) és a hangyáról, Aiszóposz óta számos feldolgozást megért. Az archaikus magyarsággal megírt változat 1536-ban vagy még korábban született, Pesti Gábor fordításában. Ezt onnan tudom, hogy megtaláltam az RPHA-ban, sőt meg is tudom nézni, hogyan festett a szöveg, amikor Bécsben kinyomták:

Forrás: oszk.hu

Hogy mi az RPHA, azt a magyar nyelv korai emlékei után kutató bölcsészeken kívül kevesen tudják, pedig technikatörténeti jelentősége is van: a négy betű egy 45 éve létező kutatói adatbázist takar, ami egyben az egyik első magyar tartalom volt az interneten, és azóta is bővül. Annyira, hogy még a múlt héten is frissült.

Peremfeltételek

Az RPHA (ami a Répertoire de la poésie hongroise ancienne rövidítése) Horváth Iván irodalomtörténész nagy projektje, ami tehát négy és fél évtizede kezdődött. Horváth mindig is érdeklődött a számítástechnika iránt, és a hetvenes években már nagyjából minden kutatóintézetben dolgoztak is komputerek. A modern számítógépes adatbázisok elődei azonban már korábban is léteztek, mindenféle elektronika nélkül, széles körben használtak például peremlyukkártyás katalógusokat.

A peremlyukkártya olyan, kemény papírból készült lap, ami az adatbázis egy „bejegyzését” (rekordját, ha úgy tetszik) tartalmazza, a kártya szélén pedig lyukak és bevágások találhatók. E bevágások elhelyezkedése fontos, ugyanis mindegyik egy-egy információt kódol, attól függően, hogy mi a pozíciója. A kártya szélének minden oldalán lehet így jelezni információkat, és ez gyakorlatilag az adatbázis keresőkulcsainak felel meg. Ha például az adatbázisunkban szeretnénk összegyűjteni a Föld országait, és kezdőbetű szerint akarunk keresni benne, akkor Afganisztán, Andorra és Albánia (meg a többi A-betűs ország) kártyáján is ugyanott kell bevágni a kártyát, és ez a bevágás az A kezdőbetűt fogja kódolni. És hogy miként történt egy ilyen rendszerben a keresés? A peremlyukkártyákhoz tartozott egy válogató gép vagy egy kézi keret, amibe be lehetett rendezni az összes kártyát, majd egy hosszú, vékony rudat áttűzni az egész paksamétán, valamelyik lyuknál. Ezután meg kellett rázni a kártyákat, és azok a kártyák, amiknél pont a rúd pozíciójában volt a bevágás, nem akadtak fenn a rúdon és kiestek – az adatbázisból megkaptuk a keresés eredményét. Mutatom ábrán is, Molnár Imre 1970-ben megjelent, Peremlyukkártyás dokumentációs rendszerek létesítése kutatóintézeti könyvtárban című, nagy hatású művéből:

Egy ilyen peremlyukkártyás rendszer sokkal olcsóbb, mint egy számítógép, mégis összetett kulcsolásokat is létre lehet hozni vele. Horváth Iván egy ilyen, NDK gyártmányú rendszerrel kezdte el a munkát a hetvenes években, amikor kollégáival fejébe vette, hogy leltárba szedi az összes ismert, régi magyar verset (nagyjából 1600-ig). Egy peremlyukkártya 40 fillérbe került (akkor, amikor egy kiló krumpli 5 forint volt), az tartalmazta egy-egy vers adatait, minden ismert bibliográfiai, irodalomtörténeti és poétikai információját. „Káderlapok” voltak a régi magyar versekről – idézi Képes Gábor muzeológus-költő Horváthot.

No, éta poéta

Az RPHA úttörő vállalkozás volt, amire Horváth így emlékezett vissza egy régi cikkében: „…a szöveg tulajdonságai (pl. szerzője, terjedelme, irodalmi mintája, műfaja, versformája, szereztetési dátuma, ajánlása stb.) mind-mind változók, amelyek a szövegnek a különböző kiadványokban és kéziratokban való előfordulásai során különféle értékeket vehetnek fel. A szövegnek nincs egyetlen állandó tulajdonsága sem: a magas irodalom és a népköltészet közötti különbség csupán fokozati. Az RPHA-csoport adatmodellje megengedi, hogy egy szöveghez több (kézírásos vagy nyomtatott) könyv, egy könyvhöz több szöveg tartozzék. Az adatfelvételi egység nem a könyv, mint a könyvtári adatbázisokban, és nem is a szöveg, mint az irodalomtudományiakban, hanem könyv és szöveg egyszeri találkozása.”

A kártyákból a fent említett módon kerestek: egy plexi válogatóba berendezték a kártyákat, majd a megfelelő helyen kötőtűt szúrtak át a válogatón, és miután megrázták a plexidobozt, az „adatbázisból” kipotyogtak a keresésnek megfelelő adatok, azaz kártyák. Az RPHA technikai szerkesztője jelenleg Horváth professzor fia, Horváth Andor, ő kért nekünk egy fényképet a szüleitől, akik még őrzik ezt a plexi válogatót, néhány fel nem használt (tehát bevágásokat nem tartalmazó) kártyával:

Fotó: Horváth Iván

Az RPHA rövid ideig így, peremlyukkártyás rendszerként létezett, majd megkezdődött a digitalizálása. A kártyákon szereplő adatokat felvitték a szegedi egyetem akkori nagyszámítógépeire, előbb egy NDK, majd egy szovjet gyártmányúra. Ezeken használhatták az RPHA-t az irodalomkutatók, akik a kutatás közben is felfedeztek új szövegeket, és az adatbázis bővült. A teljes nagygépes verzió 1979-re készült el.

Kártyákról a netre

Az első digitalizálást további, korszerűbb változatok követték. „1989-ben született meg a DOS-os változat, de azt nagyon össze kellett nyomni” – emlékszik vissza Horváth Andor. „A teljes adatbázis körülbelül harminc megabájtot tett ki, de akkor csak tíz megabájtos merevlemez volt a pc-ben.”

1992-ben aztán az RPHA nyomtatásban is megjelent, Párizsban. A kétkötetes mű gyakorlatilag egy adatbázisexport volt, szép tipográfiával. Ez a kiadvány volt az alapja aztán a következő digitalizálásnak, ami már rögtön internetre készült, a SZTAKI-ban. A sztaki.hu konkrétan az első bejegyzett magyar domén volt 1991. október 25-én, de az első magyar honlapok csak 1993-ban indultak be. Túlzás nélkül kijelenthető tehát, hogy amikor a peremlyukkártyás gyökerű RPHA 1993 novemberében számos új szöveggel kiegészítve megjelent az interneten, a magyar web egyik első komoly projektje volt. És akkor említsük meg a BBOM-ot is, ami a kilencvenes évek végén nőtt ki az RPHA-ból, Balassi Bálint ismert műveiből: ez volt ugyanis a világ első hálózati kritikai szövegkiadása.

Az adatbázis később SQL-alapú változattal élt tovább. Tíz évvel ezelőtt ismét számítógépre vitték a DOS-os változatból kimaradt információkat, melyekből csak a szovjet nagygép nyomtatott kimenete maradt meg, és Horváth Andor bő egy éve kezdett életet lehelni a félkész kiadásba. Ennek újdonsága, hogy a versek különböző változatait is számon tartja, ugyanis léteznek olyan művek, amiknek több autentikus példányuk ismert. „Ezeknél nem tudni, melyik az igazi, az eredeti. Több száz versnek létezik például protestáns és katolikus változata is” – meséli Horváth.

Dalra, magyar

Bár az RPHA publikus, azért nem a hétköznapi felhasználóra szabták. Az adatbázis eredetileg terjedelmi okokból csak a versek adatait tartalmazta, írott szövegüket nem (ez most is így van), az adatbázisban való kereséshez pedig nem árt végigolvasni a használati útmutatót.

Képernyőkép az RPHA DOS-os és jelenlegi verziójából, ugyanarról a versről

Ugyanakkor az elmúlt években az RPHA – bár továbbra is elsősorban kutatók munkaeszköze – olyan újdonságokkal bővült, amiket a laikusok is élvezhetnek. Például az OSZK digitalizált anyagaival összekötve már több helyen elérhető a szövegek forrásképe (mint a cikk elején látott Pesti-kötetnél). A legutóbbi rendszerfrissítés múlt héten történt, ez is egy fontos értéket adott az RPHA-hoz: az adatbázist összekötötték az Akadémiai Kiadó oldalán található régi magyar dallamtárral (sajtó alá rendezte Ferenczi Ilona). Így ha a vershez létezik ismert dallam is, az adatok mellett a kotta is megjelenik az adatlapon.

Az RPHA-ban jelenleg 1521 vers található, kizárólag első forrásból származó, ellenőrzött adatokkal. Ezzel és felépítésével a téma legtöbbet tudó versadatbázisai közé tartozik, amit kiemel a szakirodalom, és megkerülhetetlen mindenkinek, aki régi magyar költészettel foglalkozik. Horváth Andor szerint a munka mégsem ért véget, mert az adatbázis bővíthető, vannak tervek arra, hogy a 17. századi versek is belekerülnek, illetve a többi hasonló európai versadatbázissal is szeretnék összekötni.

Aki szeretné kipróbálni az RPHA-t, a nyitóoldalából kiindulva böngészhet a 45 éve rögzített adatok között. Az eredeti adatbázist Horváth Iván vezetésével Font Zsuzsa, Herner János, Hubert Gabriella, Szőnyi Etelka és Vadai István állította össze. A szerkesztésben Horváth Iván a mai napig részt vesz feleségével, Hubert Gabriellával. Ők biztosan hangyák lennének a picsek és a hangya meséjében.