Reddit heeft woensdag een federale rechtszaak aangespannen in New York en beschuldigt AI-zoekbedrijf Perplexity en drie datamakelaars van een plan op”industriële schaal”om de inhoud ervan onrechtmatig te schrappen.

In zijn klacht beweert Reddit dat Perplexity, met hulp van SerpApi, Oxylabs en AWMProxy, beveiligingsmaatregelen heeft omzeild om gebruikersgesprekken rechtstreeks uit Google Search te stelen resultaten.

Een dergelijke methode omzeilt de officiële licentiekanalen van Reddit, die partners als Google en OpenAI gebruiken. Reddit beweert dat de verdachten een last onder dwangsom hebben genegeerd en de auteursrechtwet hebben overtreden, waardoor de strijd van de technologie-industrie over het eerlijke gebruik van gegevens voor het trainen van AI-modellen is geëscaleerd.

Een’bankoverval’door De achterdeur van Google

De kern van het geschil is een nieuwe methode voor gegevensverzameling die zich richt op de tussenpersonen van het internet (zoekmachines) in plaats van op de bron zelf.

Reddit’s klacht beweert dat de beklaagden tools hebben ontwikkeld om Google’s eigen anti-scraping-beschermingen te omzeilen, waardoor ze op grote schaal Reddit-inhoud van pagina’s met zoekresultaten van zoekmachines (SERP’s) kunnen verzamelen.

De rechtszaak bevat meerdere aanklachten, waaronder oneerlijke concurrentie, ongerechtvaardigde verrijking en schendingen van de Digital Millennium Copyright Act (DMCA).

In een juridisch dossier boordevol strijdlustig taalgebruik heeft Reddit de beklaagden niet alleen gepositioneerd als regelovertreders, maar ook als deelnemers aan een ‘datawitwaseconomie’.

“AI-bedrijven zijn verwikkeld in een wapenwedloop om hoogwaardige menselijke inhoud – en die druk heeft een ‘datawitwaseconomie’ op industriële schaal aangewakkerd.” Bedrijfsadvocaten voerden aan: “In zeer reële zin zijn deze beklaagden vergelijkbaar met potentiële bankovervallers, die, wetende dat ze niet in de bankkluis kunnen komen, in plaats daarvan inbreken in de gepantserde vrachtwagen die het geld vervoert.”

Om zijn beschuldigingen te bewijzen, voerde Reddit een digitale steekoperatie uit. Er werd een’testpost’gecreëerd die zo was geconfigureerd dat deze alleen toegankelijk was voor de zoekcrawler van Google en nergens anders online.

Binnen enkele uren kon de antwoordengine van Perplexity de inhoud van het bericht reproduceren. Reddit beweert dat dit een onweerlegbaar bewijs is van het plan, aangezien de enige manier waarop Perplexity de gegevens had kunnen verkrijgen was door deze uit de zoekresultaten van Google te schrappen.

Het belangrijkste juridische wapen van Reddit is de DMCA. Concreet beroept het zich op Sectie 1201, waardoor het illegaal wordt gemaakt om technologische maatregelen te omzeilen die de toegang tot auteursrechtelijk beschermde werken controleren. Reddit stelt dat zowel de eigen sitebeveiligingen als het SearchGuard-systeem van Google als dergelijke maatregelen in aanmerking komen. Door zich te richten op het omzeilen, biedt de wet een krachtig instrument tegen diensten die scraping mogelijk maken, en niet alleen tegen degenen die dit uitvoeren.

De kroonjuwelen beschermen: de tweeledige datastrategie van Reddit

Aan de basis van de juridische strijd ligt de enorme waarde van Reddits enorme archief van menselijke gesprekken.

Een recent rapport van analysebureau Profound bevestigde dat Reddit is het meest geciteerde domein van alle grote AI-modellen, waardoor de inhoud ervan een cruciale bron is voor het trainen van grote taalmodellen. De unieke, voortdurend bijgewerkte opslagplaats van menselijke ervaringen is een goudmijn voor de data-hongerige AI-industrie.

Reddit onderkent dit en heeft een stevige, tweeledige strategie aangenomen: inkomsten genereren door partnerschap en beschermen door middel van rechtszaken.

Het bedrijf heeft lucratieve datalicentieovereenkomsten gesloten met grote AI-spelers, waaronder een jaarlijkse deal van $ 60 miljoen met Google en een andere met OpenAI. Deze overeenkomsten bieden een formeel, betaald pad naar de inhoud ervan.

Tegelijkertijd heeft Reddit laten zien dat het op agressieve wijze bedrijven zal vervolgen waarvan het denkt dat ze zijn gegevens zonder toestemming gebruiken.

De nieuwe rechtszaak volgt op een soortgelijke juridische actie die in juni 2025 tegen AI-startup Anthropic werd aangespannen wegens vermeend gegevensschrapen zonder vergunning. Samen wijzen deze zaken op een duidelijk en standvastig beleid om data te verdedigen als een kernbedrijfsmiddel.

Perplexity in the Crosshairs: A Pattern of Publisher Conflict

Terwijl Perplexity publiekelijk de vrije toegang tot kennis verdedigt, schetst de rechtszaak van Reddit een beeld van een bedrijf dat opzettelijk de regels van het platform omzeilt.

Volgens de klacht schetst de rechtszaak van Reddit een beeld van een bedrijf dat doelbewust de regels van het platform omzeilt.

Volgens de klacht, Reddit stuurde in mei 2024 een staakt-het-en-ophouden-brief naar Perplexity. In plaats van hieraan te voldoen, beweert Reddit, is het gebruik van de inhoud door Perplexity enorm toegenomen, waarbij het aantal citaten verveertigvoudigde.

Door SerpApi, Oxylabs en AWMProxy als mede-samenzweerders te benoemen, worden ze in de rechtszaak ervan beschuldigd de technische middelen te hebben geleverd om de beveiliging te omzeilen. Het beschrijft AWMProxy bijzonder streng en citeert onderzoekswerk dat het linkt aan het “voormalige Russische botnet” Glupteba.

Details in de indiening schilderen een onthutsend beeld van de omvang van de operatie; Reddit beweert dat de scrapingbedrijven gedurende een enkele periode van twee weken in juli 2025 op illegale wijze toegang hebben gekregen tot bijna drie miljard Google-zoekpagina’s die de inhoud ervan bevatten.

Reddit’s juridisch hoofd, Ben Lee, verklaarde:”Perplexity is een gewillige klant van ten minste één van deze scrapers, die ervoor kiest om gestolen gegevens te kopen in plaats van een wettige overeenkomst met Reddit zelf aan te gaan.”

Alle genoemde verdachten hebben dit krachtig gedaan. ontkende de beschuldigingen. In een verklaring zei Jesse Dwyer, hoofd communicatie van Perplexity: “Onze aanpak blijft principieel en verantwoordelijk omdat we feitelijke antwoorden bieden met nauwkeurige AI, en we zullen geen bedreigingen tegen de openheid en het publieke belang tolereren.”

Ryan Schafer, directeur bij SerpApi, zei tegen Adweek: “We zijn het absoluut niet eens met de aantijgingen van Reddit en zijn van plan onszelf krachtig te verdedigen in rechtbank.”

Oxylabs’Chief Governance and Strategy Officer, Denas Grybauskas, herhaalde dit en verklaarde dat het bedrijf”niet zal aarzelen om zichzelf tegen deze beschuldigingen te verdedigen”.

Voor Perplexity is dit niet de eerste keer dat het met dergelijke beschuldigingen te maken krijgt. Het AI-bedrijf voert al rechtszaken van grote uitgevers, waaronder News Corp, Encyclopedia Britannica en Merriam Webster.

Het werd ook publiekelijk beschuldigd door webbeveiligingsbedrijf Cloudflare van het gebruik van’stealth crawlers’om websiteregels te omzeilen en inhoud te schrappen van sites die dit expliciet hadden verboden.

Deze laatste rechtszaak van Reddit voegt nog een grote juridische uitdaging toe aan een groeiende lijst: door de gegevensverzamelingspraktijken van Perplexity onder de loep te nemen.

Categories: IT Info