Reddit heeft een rechtszaak aangespannen tegen de Amerikaanse AI-start-up Perplexity AI en drie dataverzamelbedrijven wegens het ongeoorloofd gebruiken van Reddit-inhoud om kunstmatige intelligentiemodellen te trainen. Volgens de aanklacht, ingediend bij de federale rechtbank in New York, zouden de bedrijven zonder toestemming grote hoeveelheden auteursrechtelijk beschermd materiaal hebben ‘geschraapt’ van het platform.
Ongeoorloofd gebruik
De drie betrokken datapartners — SerpApi uit Texas, Oxylabs uit Litouwen en AWMProxy uit Rusland — worden door Reddit vergeleken met ‘bankovervallers’. In de aanklacht stelt het bedrijf dat Perplexity “alles lijkt te willen doen om aan Reddit-data te komen, behalve een eerlijke overeenkomst sluiten zoals andere bedrijven hebben gedaan.”
Sommige AI-bedrijven hebben wél licenties afgesloten. Zo sloot OpenAI vorig jaar een overeenkomst met Reddit om data te gebruiken voor het trainen van grote taalmodellen, een deal die naar verluidt rond de 60 miljoen dollar waard was. Ook Google heeft een licentieovereenkomst met Reddit. Het platform mikt erop om in totaal 200 miljoen dollar aan licentie-inkomsten te genereren in de komende drie jaar.
Hoogwaardige menselijke content
Volgens Reddit’s juridisch directeur Ben Lee heeft de strijd om hoogwaardige menselijke content geleid tot “een industriële schaal van datadiefstal.” Hij beschuldigt de scrapingbedrijven ervan beveiligingsmaatregelen te omzeilen om data te stelen en die door te verkopen aan AI-ontwikkelaars die hongerig zijn naar trainingsmateriaal.
In de rechtszaak beweert Reddit zelfs dat het Perplexity heeft “uitgelokt” door een testbericht te plaatsen dat alleen zichtbaar was voor Google’s zoekmachine. Binnen enkele uren zou de inhoud van dat bericht zijn opgedoken in Perplexity’s resultaten. Een duidelijk bewijs, aldus Reddit, dat het bedrijf onrechtmatig data heeft verzameld.
Krachtig verzet
Perplexity reageerde door te zeggen dat het de aanklacht nog niet heeft ontvangen, maar dat het zich ‘krachtig zal verzetten’ tegen de claims. In een verklaring stelde het bedrijf: “Wij verdedigen het recht van gebruikers om vrij en eerlijk toegang te hebben tot publieke kennis. Onze aanpak blijft principieel en verantwoordelijk.”
Met deze stap intensiveert Reddit zijn juridische strijd tegen bedrijven die zonder toestemming gebruikmaken van zijn data, een strijd die symbool staat voor de groeiende spanningen tussen sociale platforms en de snel uitbreidende AI-industrie.