Kellemetlen üggyel néz szembe az NVIDIA, ugyanis a TorrentFreak riportja szerint egy kibővített csoportos keresetben több könyvszerző is azt állítja, hogy a vállalat közvetlenül megkereste az Anna’s Archive néven ismert kalóz árnyékkönyvtárat, hogy nagy sebességű hozzáférést szerezzenek az illegálisan tárolt tartalmakhoz.
Az NVIDIA a hardverek fejlesztésén túl saját nyelvi modelleket is tréningel, többek között a NeMo-t, a Retro-48B-t, az InstructRetrót és a Megatront. Ezekhez rengeteg szöveges adat szükséges, amit valamilyen formában meg kell szerezniük.
Hirdetés
A fentiek miatt az egyes modellek tréningjéhez felhasznált tartalmak tulajdonjogát birtokló szerzők régóta harcolnak az AI-piac nagyobb szereplői ellen, mondván kalózoldalakról beszerzett adatok formájában tanítják be a rendszereiket, illetve ha ez nem bizonyítható, akkor is felmerül az, hogy a tartalmak tényleges birtoklása mellett milyen joga lehet erre a tréningen dolgozó cégnek.
Az NVIDIA ügye a 2024-es évig nyúlik vissza, amikor több szerző indított a vállalat ellen csoportos keresetet, arra hivatkozva, hogy vállalat a saját modelljeit a Books3 adatkészleten tanította be, amely egy jellemzően szerzői jog által védett műveket tartalmazó kalózkönyvtár. A zöldek a saját védelmükben a fair use-ra, vagyis a tisztességes felhasználásra hivatkoztak, kiemelve azt is, hogy a könyvek nem többek statisztikai korrelációknál.
Az egész ügy most bonyolultabb lett, ugyanis a kibővített csoportos keresetnek már az Anna’s Archive is a része, továbbá a szerzők az NVIDIA belső levelezéseire és dokumentumaira hivatkozva azt állítják, hogy a cég tudatosan kereste meg az említett kalóz árnyékkönyvtár üzemeltetőit, hogy kiderítsék mit tudnak biztosítani a későbbi tréningekhez.
A keresetkiegészítés szerint az Anna’s Archive több ezer dollárt kér a kalózgyűjteményhez való nagy sebességű hozzáférésért cserébe, és az NVIDIA konkrétan ki akarta deríteni, hogy ez ténylegesen milyen tempót takar. Itt jön viszont az érdekes rész. Az Anna’s Archive, tanulva a többi AI-ban utazó cég hasonló irányú megkereséséből, előre figyelmeztette az NVIDIA-t, hogy a tárolt tartalmaikat illegálisan szerezték meg. Emiatt azonnal arról érdeklődtek az NVIDIA képviselőinél, hogy van-e a cégvezetők részéről kiállított engedélyük az ilyen jellegű adatok felhasználására. Eredetileg nem volt, de egy héten belül megszerezték ezt, így a vád szerint az NVIDIA vezetése közvetlenül engedélyezte a kalózkodást.
A konkrétumokat tekintve a kereset mintegy 500 terabájtnyi adatról ír, amelyhez az Anna’s Archive hozzáférést ígért, arra viszont nem tér ki egyértelműen, hogy végül az NVIDIA fizetett-e. Azzal viszont vádolják a céget, hogy több kalózforrásból töltöttek le tartalmakat, a már említett két lehetőségen túl a LibGenből, a Sci-Hubból és a Z-Libraryből is.
Ez viszont még nem minden, mert a szerzők szerint az NVIDIA lehetővé tette az ügyfelei számára, hogy a Books3 kalózkönyvtárból felépített adathalmazt felhasználhassák, vagyis effektíve az NVIDIA elvégezte a partnerei helyett a kalózkodást, hogy nekik már ne kelljen. A zöldek így bevételt tudtak termelni abból, hogy megkönnyítették az ügyfeleiknek a kalóz adatkészletekhez való hozzáférést.
A szerzők a fentiek miatt kártérítést követelnek az elszenvedett károkért, ami nem csak a keresetben már résztvevő embereket érinti, hanem az esetlegesen később csatlakozókat is.
