2min Ondernemen

AI-bedrijf Perplexity aangeklaagd door Amerikaanse kranten

AI-bedrijf Perplexity aangeklaagd door Amerikaanse kranten

Twee Amerikaanse kranten klagen Perplexity aan vanwege auteursrechtbreuk van het AI-bedrijf. Het gaat om de wereldberoemde New York Times en Chicago Tribune, grote en invloedrijke Amerikaanse dagbladen.

Volgens NYT gebruikt Perplexity content van journalistieke producties om antwoorden te kunnen geven op vragen die worden gesteld aan de AI-dienst. De krant heeft daar echter geen toestemming voor gegeven en ook is er geen vergoeding mee gemoeid. Daarbij gaat het ook regelmatig om content dat achter een paywall is geplaatst en waar je normaliter voor moet betalen om te lezen.

Er zijn verschillende verzoeken ingediend bij de AI-dienst om hiermee te stoppen, maar de dienst blijft hier mee doorgaan zo schrijft The New York Times. Een woordvoerder van de krant licht toe: “Perplexity gebruikt onze content om zijn product te ondersteunen via een proces genaamd retrieval-augmented generation (RAG). Met RAG kan Perplexity het internet afstruinen en content van achter onze betaalmuur stelen en in realtime aan zijn klanten leveren. Deze content mag alleen toegankelijk zijn voor onze betalende abonnees.”

The New York Times zegt wel te geloven in het ethische en verantwoorde gebruik van AI en de ontwikkeling daarvan, maar ze verzetten zich wel tegen het ongeoorloofde gebruik van content van hun platform. Tot slot laat de woordvoerder weten dat ze zich zullen blijven inzetten tegen bedrijven die weigeren om waarde van hun werk te erkennen. De Chicago Tribune heeft een soortgelijk statement uitgebracht.

Reddit klaagt Perplexity aan wegens ongeoorloofd gebruik van data voor AI-training

AI trainen doe je met data, veel data

Trainen van AI-modellen zoals Perplexity, maar bijvoorbeeld ook Gemini van Google of GPT-modellen van OpenAI gaat gepaard met enorme datasets. Veel AI-bedrijven zijn vaker in opspraak geweest, omdat niet altijd duidelijk is waar die data vandaan komt en of dat allemaal volledig legitiem verkregen is.

Zo haalde de Nederlandse Stichting Brein in 2024 nog een illegale Nederlandstalige dataset offline, omdat daar kopieën van auteursrechtelijk beschermde werken in aanwezig waren. Daarbij ging het onder andere om content van tienduizenden boeken, ondertiteling van ontelbaar veel films en tv-series en ook miljoenen tekstregels uit nieuwsberichten van verschillende websites.