De rechtszaak van RIAA tegen startups voor generatieve muziek zal het bloedbad zijn dat AI nodig heeft

Zoals veel AI-bedrijven vertrouwden Udio en Suno op grootschalige diefstal om hun generatieve AI-modellen te creëren. Dat is zoveel als ze toegaven, zelfs voordat de nieuwe rechtszaken van de muziekindustrie tegen hen voor de rechter kwamen. Als het voor een jury komt, kan het proces zowel een schadelijke onthulling zijn als een zeer nuttig precedent voor eveneens onethische AI-bedrijven die met bepaalde juridische gevaren worden geconfronteerd.

De rechtszaken zijn maandag met veel tamtam aangespannen door de Publishing Industry Association of America, waardoor we allemaal in de ongemakkelijke positie terecht zijn gekomen dat we steun moeten verlenen aan de RIAA, die al tientallen jaren de boeman van de digitale media is. Ik persoonlijk werd smerig van hen! De zaak is gewoon zo duidelijk.

De essentie van de twee rechtszaken, die qua inhoud opmerkelijk veel op elkaar lijken, is dat Suno en Udio (strikt genomen Uncharted Labs die zaken doen als Udio) willekeurig min of meer de hele geschiedenis van opgenomen muziek hebben geplunderd om datasets te vormen, die ze vervolgens gebruikten om train AI die muziek maakt.

En laten we hier snel opmerken dat deze AI’s niet zozeer “genereren”, maar dat ze op een gebruikersprompt reageren met patronen uit hun trainingsgegevens en vervolgens proberen dat patroon te voltooien. In zekere zin voeren deze modellen alleen maar covers of remixen uit van nummers die ze hebben verslonden.

Dat Suno en Udio bovenstaande gegevens hebben ingevoerd, is in alle opzichten (inclusief juridische doeleinden) ongetwijfeld het geval. Het management en de investeerders van bedrijven zijn onredelijk ontspannen geweest over auteursrechtelijke uitdagingen in de sector.

Ze erkenden dat de enige manier om een goed model voor het genereren van muziek te creëren het binnenbrengen van een grote hoeveelheid muziek van hoge kwaliteit was, waarvan de meeste auteursrechtelijk beschermd zouden zijn. Het is eenvoudigweg een noodzakelijke stap om een dergelijk machine learning-model te creëren.

Vervolgens gaven ze toe dat ze dit hadden gedaan zonder toestemming van de auteursrechteigenaar. Investeerder Brian Hiatt zei een paar maanden geleden tegen Rolling Stone:

Eerlijk gezegd, als we labeldeals hadden gehad toen dit bedrijf begon, zou ik er waarschijnlijk niet in hebben geïnvesteerd. Ik denk dat ze dit product zonder beperkingen moesten maken.

Vertel me dat je een eeuw muziek hebt gestolen zonder me te vertellen dat je een eeuw muziek hebt gestolen, begrijp ik. Voor de duidelijkheid: met ‘beperkingen’ bedoelt hij het auteursrecht.

Uiteindelijk vertelden de bedrijven aan de advocaten van de RIAA dat ze geloofden dat het terughalen van al deze media onder de fair use-doctrine viel – die in principe alleen een rol speelt bij ongeoorloofd gebruik van het werk. Nu is eerlijk gebruik weliswaar een complex en vaag concept qua idee en uitvoering. Maar een bedrijf met 100 miljoen dollar op zak steelt elk nummer dat ooit is gemaakt, zodat het ze massaal kan repliceren en de resultaten kan verkopen: ik ben geen advocaat, maar het lijkt enigszins buiten de beoogde veilige haven van bijvoorbeeld een zevende te zijn afgedwaald. grader met het nummer Pearl Jam op de achtergrond van je video over de opwarming van de aarde.

Eerlijk gezegd lijkt de kip van deze bedrijven gaar. Ze hoopten blijkbaar dat ze een pagina uit het draaiboek van OpenAI zouden kunnen nemen, waarbij ze in het geheim auteursrechtelijk beschermde werken zouden gebruiken en vervolgens ontwijkende taal en misleiding zouden gebruiken om hun critici met lagere zakken, zoals auteurs en journalisten, tegen te houden. Als tegen de tijd dat de uitvluchten van de AI-bedrijven worden ontdekt, zij de enige optie voor distributie zijn, doet het er niet meer toe.

Met andere woorden: weigeren, afleiden, uitstellen. Idealiter kun je eraan draaien totdat de rollen omgedraaid zijn en je een deal krijgt met je critici – voor LLM zijn dat nieuwsmedia en dergelijke, en in dit geval zijn dat platenlabels, die de muziekgeneratoren duidelijk hoopten te bereiken. uiteindelijk uit machtsposities komen. ‘Natuurlijk hebben we je spullen gestolen, maar nu is het een groot probleem; Zou je niet liever met ons spelen dan tegen ons?” Het is een gebruikelijke strategie in Silicon Valley en een winnende strategie, omdat het meestal alleen maar geld kost.

Maar dat is moeilijker als je een smoking gun in je hand hebt. En helaas voor Udi en Suno heeft de RIAA enkele duizenden rokers die roken in de rechtszaak betrokken: de nummers die zij bezit, die de muziekmodellen blijkbaar teruggeven. Jackson 5 of Maroon 5, de “gegenereerde” nummers zijn slechts licht vervormde versies van het origineel – iets dat onmogelijk zou zijn als het origineel niet in de trainingsgegevens was opgenomen.

De aard van LLM’s – in het bijzonder hun neiging om te hallucineren en de plot te verliezen naarmate ze meer schrijven – maakt het onmogelijk om bijvoorbeeld hele boeken terug te geven. Dit heeft waarschijnlijk geleid tot de rechtszaak van de auteur tegen OpenAI, omdat laatstgenoemde op geloofwaardige wijze kan beweren dat de fragmenten die het model citeert afkomstig zijn uit recensies, voorpagina’s die online beschikbaar zijn, enzovoort. (De laatste zet op de doelpaal is dat ze deed gebruikte het auteursrecht al vroeg, maar sindsdien zijn ze ermee gestopt, wat grappig is, want het is alsof je zegt dat je maar één keer in een sinaasappel hebt geperst, maar dat je er sindsdien mee bent gestopt.)

Wat jij ik kan niet Het is plausibel om te beweren dat je muziekgenerator slechts een paar maten van “Great Balls of Fire” heeft gehoord en er op de een of andere manier in is geslaagd de rest woord voor woord en akkoord voor akkoord uit te spugen. Elke rechter of jury zou je uitlachen, en met een beetje geluk krijgt een rechtszaalkunstenaar de kans om het te illustreren.

Dit is niet alleen intuïtief voor de hand liggend, maar ook juridisch consequent, omdat het duidelijk is dat de modellen hele werken reconstrueren – soms slecht natuurlijk, maar volledige liedjes. Hierdoor kan de RIAA beweren dat Udio en Suno reële en substantiële schade toebrengen aan de bedrijven van auteursrechthouders en artiesten opnieuw uitbraken – waardoor ze een rechter kunnen vragen om de volledige activiteiten van de AI-bedrijven te sluiten bij aanvang van een gerechtelijk bevel. .

De openingsparagrafen van uw boek verschijnen met LLM? Het is een intellectuele kwestie waarover uitvoerig moet worden gedebatteerd. Dollarwinkel “Bel me misschien” op aanvraag gegenereerd? Zet het uit. Ik zeg niet dat het waar is, maar het is waarschijnlijk.

Het voorspelbare antwoord van de bedrijven was dat dit niet het geval was bedoeld auteursrechtelijk beschermde werken repliceren: een wanhopige, kale poging om de aansprakelijkheid af te schuiven op gebruikers onder Sectie 230, de veilige haven. Dat wil zeggen, net zoals Instagram niet verantwoordelijk is als je een auteursrechtelijk beschermd nummer gebruikt ter ondersteuning van je Reel. Op dit punt lijkt het onwaarschijnlijk dat het argument aan kracht zal winnen, deels vanwege de eerder genoemde bekentenissen dat het bedrijf zelf het auteursrecht in eerste instantie heeft verwaarloosd.

Wat zullen de gevolgen zijn van deze rechtszaken? Zoals met alles wat met AI te maken heeft, is het vrijwel onmogelijk om dit van tevoren te zeggen, omdat er weinig precedent of toepasbare, vaste doctrine bestaat.

Mijn voorspelling, wederom zonder enige echte expertise, is dat bedrijven gedwongen zullen worden om met hun data en trainingsmethoden naar buiten te komen, omdat deze zaken van duidelijk bewijsbelang zijn. Het zien van dit en hun flagrante misbruik van auteursrechtelijk beschermd materiaal, samen met (vermoedelijk) communicatie waaruit blijkt dat ze de wet hebben overtreden, zal waarschijnlijk leiden tot een poging om een rechtszaak te schikken of te vermijden, en/of een snel oordeel tegen Udi en Suno. Ze zullen ook gedwongen worden om alle activiteiten die afhankelijk zijn van op diefstal gebaseerde modellen stop te zetten. Ten minste één van de twee zal proberen het bedrijf voort te zetten met behulp van legale (of op zijn minst juridisch aangrenzende) muziekbronnen, maar het resulterende model zal een grote kwaliteitsdaling betekenen en gebruikers zullen vluchten.

Investeerders? Idealiter verliezen ze hun shirt omdat ze wedden op iets dat duidelijk en aantoonbaar illegaal en onethisch is, niet alleen in de ogen van de smerige auteursrechtverenigingen, maar ook in de juridische geesten van de beruchte en meedogenloze RIAA-advocaat. Kan worden geraden of de schade contant geld of toegezegde gelden betreft.

De gevolgen kunnen verstrekkend zijn: als investeerders in een nieuwe generatieve media-startup plotseling honderd miljoen dollar zien verdampen vanwege de fundamentele aard van generatieve media, zal een ander niveau van zorgvuldigheid plotseling passend lijken. Bedrijven zullen uit rechtszaken (indien aanwezig) of schikkingsdocumenten leren wat er had kunnen worden gezegd, of nog belangrijker, wat niet had mogen worden gezegd, om aansprakelijkheid te vermijden en eigenaren van auteursrechten in het ongewisse te houden.

Hoewel deze specifieke rechtszaak bijna een uitgemaakte zaak lijkt, laat niet elk AI-bedrijf zijn vingerafdrukken zo vrijelijk achter op een plaats delict. Het zal geen draaiboek zijn voor het vervolgen of uitpersen van nederzettingen uit andere generatieve AI-bedrijven, maar een objectieve les in overmoed. Het is goed om er zo nu en dan een te hebben, ook al is de leraar de RIAA.