Elmeszelték a világ legnagyobb online könyvtárát, ami átírhatja az internetes archiválás jövőjét
2024. szeptember 8. – 22:41
A világ legérdekesebb milliárdosa, Elon Musk az utóbbi években jó sok hülyeségbe állt bele az interneten, de amikor csütörtök délelőtt kiírta az X-re, hogy „támogasd az @internetarchive-ot”, azzal kivételesen egy érdekes témába sikerült beletenyerelnie. Musk azután írta ki ezt, hogy szerdán a fellebbviteli bíróság megerősítette a Hachette kontra Internet Archive nevű, évek óta húzódó ügyben hozott elsőfokú ítéletet, ezzel
kimondta, hogy a nonprofit szervezet szerzői jogot sértett azzal, hogy egy rakás könyvet digitalizált és tett széles körben elérhetővé az interneten.
A döntés annyira nem meglepő, és az indoklások alapján abszolút megalapozottnak is tűnik, az viszont biztos, hogy precedenst teremthet abban, ahogy a bíróságok a jövőben kezelik a tartalmak digitális konzerválását. Miután pedig itt is a méltányos használat (fair use) volt az Internet Archive védekezésének központi eleme – amit a fellebbviteli bíróság végül lesöpört az asztalról –, a mesterséges intelligenciára, azon belül is a nagy nyelvi modellek fejlesztésére is hatása lehet.
Mi ez az ügy?
Mielőtt rátérnénk erre, első körben érdemes gyorsan átvenni, hogy egyáltalán mi is az az Internet Archive, amit most másodjára is elmeszeltek a bíróságon. Az Internet Archive egy 1996-ban, Amerikában alapított nonprofit szervezet, amit eredetileg azzal a céllal hoztak létre, hogy megőrizzék az internetes tartalmakat. 2001-ben az alighanem sokaknak ismerős Wayback Machine-t is létrehozták, amellyel már bárki vissza is kereshette az archivált weboldalak korábbi változatait, illetve maga is archiválhatott bármilyen weboldalt.
A szervezet már 2001-ben belevágott az interneten túlnyúló projektekbe, 2006-ban pedig létrehozták az Open Libraryt, melynek grandiózus célja az, hogy egyetlen weblapon gyűjtse össze a valaha publikált összes könyvet. Az Internet Archive jogilag digitális könyvtárnak számít, és ugyanolyan szabályok is vonatkoznak rá, mint a hagyományos könyvtárakra, azaz hiába sokszorosíthatóak a végtelenségig a digitalizált könyvek, ezeket csak korlátozott számban lehet kikölcsönözni tőlük.
Négy éve viszont, amikor a koronavírus-járvány miatt világszerte bezárni kényszerültek a közkönyvtárak, az Internet Archive úgy döntött, hogy átmenetileg eltörli a működésének alapját képező korlátozást. A 2020 márciusában bejelentett Nemzeti Vészhelyzeti Könyvtár (NEL) életre hívását azzal indokolták, hogy abban a helyzetben nagy szükség volt arra, hogy a könyvek széles körben elérhetőek legyenek, például a karanténba kényszerült diákoknak és kutatóknak.
A NEL kétségtelenül rengeteg embernek segített a járvány idején, de sokan kritizálták is, számos szerző úgy reagált rá, hogy ez lényegében nem más, mint kalózkodás, az Internet Archive pedig két hónap után végül be is rekesztette a projektet, és visszaállította a kölcsönzési limitet. Ezzel viszont már nem tudták megakadályozni, hogy több nagy könyvkiadó, a Hachette, a HarperCollins, a Penguin Random House és a Wiley is pert indítson ellene 2020 júniusában – ennek lett az eredménye a Hachette kontra Internet Archive.
Mi történt most?
Első fokon 2023 márciusában hoztak ítéletet, ekkor az ügyben eljáró bíró egyértelműen a kiadóknak adott igazat. Az Internet Archive védekezésének alapja az volt, hogy a könyvek archiválása és terjesztése a méltányos használat alá tartozik, amely bizonyos esetekben lehetővé teszi a jogvédett tartalmak nem kereskedelmi célú felhasználását, így nem is lehet jogsértő. A bíró szerint viszont az, hogy létező munkákat másolnak le és kölcsönöznek ki, nem nevezhető a tartalmak méltányos használatának.
Ezt erősítették meg most másodfokon is a szerdai végzésben. A testület arra jutott, hogy ha egy nonprofit szervezet szerzői jog által védett könyveket szkennel be teljes egészében, majd azokat az eredeti példányszámnak megfelelően kikölcsönzi anélkül, hogy erre engedélyt kérne a jogtulajdonosoktól vagy a szerzőktől, akkor azt a kérdést, hogy ezt lefedi-e a méltányos használat, a hatályos jogszabályok és a korábbi precedensek alapján csak úgy lehet megválaszolni, hogy
nem.
A testület szinte mindenben igazat adott az első fokon eljáró bírónak, és azt is elvetette, hogy az Internet Archive digitális könyvtára ugyanúgy működne, mint egy hagyományos könyvtár, mert nem az eredeti könyveket teszik kölcsönözhetővé, hanem azok másolatait. Az indoklásuk szerint az sem helytálló, hogy az Internet Archive a közjó érdekében teszi elérhetővé a birtokukban lévő könyvek digitális mását, a testület szerint ugyanis csak az biztos, hogy a gyakorlat engedélyezése miatt sérülnek a kiadók és a szerzők jogai.
Egy fontos dologban viszont módosították a korábbi ítéletet, és kimondták, hogy az Internet Archive nyilvánvalóan nem végez kereskedelmi tevékenységet csak azért, mert adományokat kapnak a látogatóiktól, ez ugyanis nagyban korlátozná az ilyen nonprofit szervezetek működését. James Grimmelmann, a Cornell Egyetem digitális és internetes joggal foglalkozó professzora a Wirednek erről azt mondta, örül, hogy másodfokon korrigálták ezt a tévedést, de ezen kívül szerinte az elmúlt időszak jogértelmezése alapján nem meglepő, hogy minden másnak helyt adtak.
Miért érdekes ez?
Az amerikai kiadókat összefogó szervezet elnöke, Maria A. Pallante üdvözölte a döntést, amellyel szerinte a bíróság megerősítette a szerzők és a kiadók jogait, és nyomatékosította, hogy nem lehet engedély nélkül átkonvertálni teljes műveket. Az Internet Archive természetesen csalódottan fogadta a döntést, és petíciót indítottak azért, hogy a kiadók visszaállítsák annak az 500 ezer könyvnek az elérését, amelyek a döntés miatt eltűntek az Open Library adatbázisából.
Dave Hansen, az Author's Alliance nevű, a műveik széles körű terjesztését szorgalmazó szerzőket tömörítő nonprofit szervezet elnöke szintén elítélte a döntést. Szerinte a szerzők is olvasnak, ők is végeznek kutatómunkát, az Internet Archive digitális könyvtára pedig nemcsak abban segíti őket, hogy új könyveket írhassanak, hanem abban is, hogy ezek aztán minél több emberhez el is jussanak.
Hansen szerint a mostani döntés a legnagyobb kiadóknak és a legnépszerűbb íróknak lehet, hogy előnyös lesz, de mindenki más rosszul fog járni vele.
Az mindenesetre biztos, hogy a jövőre nézve kiemelten fontos lehet az, hogy a jelek szerint végérvényesen jogellenessé vált az Internet Archive működésének jelentős része. Ha a szervezet úgy sem tárolhat és terjeszthet könyveket, hogy egyébként a birtokában van valódi példányoknak, és ezek függvényében teszi elérhetővé őket az adatbázisában is, azzal rengeteg ember veszítheti el a hozzáférését olyan könyvekhez, amelyeket legális módszerekkel sehogy vagy csak nagyon drágán és körülményesen lehet beszerezni.
A mesterséges intelligenciában, azon belül is a nagy nyelvi modellekben utazó cégeknek is fontos lehet az ítélet, ők ugyanis szintén a méltányos használattal szoktak takarózni, amikor a modellek tanításához használt adathalmazok miatt kritizálják őket. Persze ezeknél jóval könnyebb emellett érvelni, hiszen a modellek nem másolatokat készítenek, hanem új szövegeket, de a méltányos használatot korlátozó döntésekre ettől még biztosan oda kell figyelniük a cégeknek és az olyan adathalmazok összeállítóinak is, mint amilyen a Books3.