Nvidia ontkent dat piraterijsites voor e-boeken 'schaduwbibliotheken' zijn en sluit de rechtszaak af

Nvidia ontkent dat het illegale e-booksites zijn

Enkele van de meest beruchte zogenaamde schaduwbibliotheken worden steeds meer geconfronteerd met juridische druk om boekenpiraterij te stoppen of het risico te lopen te worden gesloten of naar het dark web te worden gebracht. Tot de grootste doelwitten behoren Z-Library, die het Amerikaanse ministerie van Justitie heeft beschuldigd van strafrechtelijke inbreuk op het auteursrecht, en Library Genesis (Libgen), die afgelopen herfst door uitgevers van leerboeken werd aangeklaagd wegens het naar verluidt verspreiden van digitale kopieën van auteursrechtelijk beschermde werken “op grote schaal”. wegens opzettelijke inbreuk op het auteursrecht.

Maar nu lijken deze schaduwbibliotheken en anderen die ervan worden beschuldigd het auteursrecht te schenden een onwaarschijnlijke verdediger te hebben gevonden in Nvidia, een AI-chipmaker onder degenen die het meest profiteren van de recente AI-hausse.

Nvidia leek de schaduwbibliotheken te verdedigen als een geldige bron van online informatie toen ze reageerde op een rechtszaak van een boekauteur over de lijst met datastores die waren verzameld om de Books3-dataset te creëren die werd gebruikt om Nvidia’s NeMo AI-platform te trainen.

Die lijst bevat enkele van de ‘meest beruchte’ schaduwbibliotheken: Bibliotik, Z-Library (Z-Lib), Libgen, Sci-Hub en Anna’s Archive, beweerden de auteurs. Nvidia hoopt echter de auteursrechtclaims van de auteurs gedeeltelijk te ondermijnen door te ontkennen dat deze controversiële websites zelfs maar als schaduwbibliotheken zouden moeten worden beschouwd.

“Nvidia ontkent de karakterisering van genoemde data-opslagplaatsen als ‘schaduwbibliotheken’ en ontkent dat het hosten of distribueren van gegevens uit de data-opslagplaatsen noodzakelijkerwijs in strijd is met de Amerikaanse auteursrechtwetgeving”, aldus Nvidia’s proces-verbaal.

De chipmaker ging niet verder in op het definiëren van wat als een schaduwbibliotheek wordt beschouwd of wat deze controversiële sites mogelijk bevrijdt van belangrijke auteursrechtkwesties die door de verschillende lopende rechtszaken naar voren zijn gebracht. In plaats daarvan hield Nvidia haar reactie kort, terwijl ze de petitie van de auteurs voor class action-status krachtig betwistte en haar AI-trainingsmethoden verdedigde als redelijk gebruik.

“Nvidia ontkent dat het de vermeende werken op ongepaste wijze heeft gebruikt of gekopieerd”, stelt de rechtbank, waarin wordt gesteld dat “training een zeer transformatief proces is dat het aanpassen van numerieke parameters, waaronder ‘gewichten’, kan inhouden en dat LLM-scores, althans gedeeltelijk, kunnen zijn gebaseerd op op zulke ‘gewichten’.”

Het argument van Nvidia hangt waarschijnlijk af van het feit dat een rechtbank het erover eens is dat AI-modellen input uit gepubliceerde werken om die werken om te zetten in gewichten die de AI-output bepalen, redelijk gebruik is. De auteurs beweerden echter dat “deze gewichten volledig en uniek zijn afgeleid van een bedrijfseigen uitdrukking in de trainingsdataset” die werd gekopieerd zonder toestemming van de auteurs of zonder compensatie aan de auteurs.

Sommige bedrijven, zoals OpenAI, zijn al begonnen met het licentiëren van inhoud van uitgevers, waardoor deze auteursrechtproblemen waarschijnlijk helemaal kunnen worden vermeden. Advocaten van de New York Times, een van de uitgevers die OpenAI aanklaagt, hebben al gesuggereerd dat OpenAI’s nieuwste deal om content van News Corp. “ondersteunt de bewering” dat “uitgevers betaald moeten worden wanneer hun werk wordt gebruikt voor AI”, meldde MediaPost.

Totdat het probleem door rechtbanken of wetgevers is opgelost, zullen bedrijven die AI trainen op de dataset van Books3 waarschijnlijk te maken krijgen met rechtszaken van rechthebbenden, vooral degenen die de AI-modellen zien als een verlengstuk van de schade die wordt veroorzaakt door deze zogenaamd illegale schaduwbibliotheken. Een advocaat van de uitgevers van leerboeken die Libgen aanklagen, Matthew Oppenheim, vertelde Ars eerder dat Libgen een ‘dievenhol’ van illegale boeken is en dat er ‘geen twijfel over bestaat’ dat Libgens gedrag ‘grootschalig illegaal’ is.

De auteurs die Nvidia aanklaagden, namen de volgende stap en koppelden de chipmaker aan de schaduwbibliotheken, waarbij ze beweerden dat “deze schaduwbibliotheken al lang van belang zijn voor de AI-trainingsgemeenschap omdat ze grote hoeveelheden niet-gelicentieerd auteursrechtelijk beschermd materiaal hosten en distribueren. Om deze reden , zijn deze schaduwbibliotheken ook in strijd met de Amerikaanse auteursrechtwetgeving.”

Terwijl Nvidia zich blijkbaar voorbereidt om auteursrechtclaims af te weren door te betwisten wat een schaduwbibliotheek is, hebben de websites die centraal staan in de rechtszaken van Nvidia wellicht minder problemen met het label. Anna, de pseudonieme maker van Anna’s Archive, gebruikt de term losjes en beschrijft de site als ‘de grootste schaduwbibliotheek ter wereld’, terwijl ze training biedt aan andere zogenaamde piratenarchivarissen.

In zekere zin is het niet zo verrassend dat Nvidia de kant van de schaduwbibliotheken leek te kiezen als het ging om het weerleggen van auteursrechtclaims.

In 2022, toen de FBI hardhandig begon te optreden tegen illegale e-booksites, vertelde Ana aan Vice dat schaduwbibliotheken zoals de hare opereren volgens het principe dat ‘informatie gratis wil zijn’. AI-bedrijven zijn waarschijnlijk erg gemotiveerd om hetzelfde te willen.

Nvidia maakte onlangs bekend dat het alleen al in het eerste kwartaal van 2024 een recordbedrag van 26 miljard dollar verdiende. Voor Nvidia en andere AI-bedrijven die de winst willen maximaliseren en de AI-markt in een vroeg stadium willen domineren, is er waarschijnlijk nog steeds geen betere prijs voor AI-trainingsgegevens dan gratis, en dus weinig betere bronnen van trainingsgegevens dan sites die gratis grote hoeveelheden informatie aanbieden.