Reddit stämmer förvirring och dataskrapor för AI-innehållsstöld i"industriell skala"

Reddit lämnade in en federal stämningsansökan i New York på onsdagen och anklagade AI-sökföretaget Perplexity och tre datamäklare för ett system i”industriell skala”för att olagligt skrapa dess innehåll.

I sitt klagomål hävdar Reddit att Perplexity, med hjälp från SerpApi, Oxylabs och AWMProxy, förbigick Googles säkerhetsåtgärder för att direkt kringgå säkerhetsåtgärder för användare. resultat.

En sådan metod kringgår Reddits officiella licenskanaler, som partners som Google och OpenAI använder. Reddit hävdar att de tilltalade ignorerade ett upphörande-och-avstå-brev och bröt mot upphovsrättslagen, vilket eskalerade teknikindustrins kamp om rättvis användning av data för att träna AI-modeller.

A <-Bank. Genom Googles bakdörr

Kärnan i tvisten är en ny metod för datainsamling som riktar sig mot intermediärerna på internet – sökmotorer – snarare än själva källan.

Reddits klagomål hävdar att de tilltalade har skapat verktyg för att kringgå Googles egna skydd mot skrapning, vilket gör det möjligt för dem att skörda Reddit-innehåll från sökmotorernas resultatsidor (SERPs) i stor skala.

Dess rättegång listar flera punkter, inklusive orättvis konkurrens, orättvis anrikning av upphovsrättslagen, Millenn-berikning, och Millen (DMCA).

I en juridisk ansökan fylld av stridbart språk har Reddit positionerat de åtalade inte bara som regelbrytare utan som deltagare i en”datatvättsekonomi”.

“AI-företag är låsta i en kapprustning om mänskligt innehåll av hög kvalitet – och det trycket har underblåst en”datatvättsekonomi”i industriell skala.”Bolagets advokater hävdade:”I en mycket verklig mening liknar dessa åtalade blivande bankrånare, som, i vetskap om att de inte kan ta sig in i bankvalvet, bryter sig in i den bepansrade lastbilen med pengarna istället.”

För att bevisa sina anklagelser genomförde Reddit en digital stingoperation. Den skapade ett”testinlägg”konfigurerat för att endast vara tillgängligt för Googles sökrobot och ingen annanstans online.

Inom några timmar kunde Perplexitys svarsmotor reproducera inläggets innehåll. Reddit hävdar att detta är ett ovedersägligt bevis på schemat, eftersom det enda sättet som Perplexity kunde ha fått data på var genom att skrapa den från Googles sökresultat.

Reddits primära lagliga vapen är DMCA. Specifikt åberopar den Section 1201, vilket gör det olagligt att kringgå tekniska åtgärder som kontrollerar åtkomst till upphovsrättsskyddade verk. Reddit hävdar att både dess egna webbplatsskydd och Googles SearchGuard-system kvalificerar sig som sådana åtgärder. Genom att inrikta sig på kringgåendet ger lagen ett kraftfullt verktyg mot tjänster som möjliggör skrapning, inte bara de som utför det.

Protecting the Crown Jewels: Reddit’s Two-Pronged Data Strategy

Bakgrunden till den juridiska striden är det enorma värdet av Reddits enorma konversationsrapport.

från ett djupgående arkiv av mänskliga konversationer.

bekräftade att Reddit är den enskilt mest citerade domänen i alla större AI-modeller, vilket gör dess innehåll till en kritisk resurs för att träna stora språkmodeller. Dess unika, ständigt uppdaterade arkiv med mänskliga erfarenheter är en guldgruva för den datahungriga AI-industrin.

För att erkänna detta har Reddit antagit en fast, tvådelad strategi: tjäna pengar genom partnerskap och skydda genom rättstvister.

Företaget har tecknat lukrativa datalicensavtal med Google med en annan AI-aktör som rapporteras årligen med 60 miljoner dollar, inklusive en stor AI-aktör på 60 miljoner dollar. Dessa avtal etablerar en formell, betald väg till dess innehåll.

Samtidigt har Reddit visat att det aggressivt kommer att förfölja företag som de tror använder dess data utan tillstånd.

Dess nya stämningsansökan följer på en liknande rättslig åtgärd som lämnades in mot AI-startupen Anthropic i juni 2025 för påstådd olicensierad dataskrot. Tillsammans signalerar dessa fall en tydlig och orubblig policy att försvara sin data som en kärnverksamhetstillgång.

Perplexity in the Crosshairs: A Pattern of Publisher Conflict

Medan Perplexity offentligt förespråkar fri tillgång till kunskap, målar Reddits rättegång en bild av företagets avsiktliga plattform.

Enligt klagomål skickade Reddit ett upphörande-och avstå-brev till Perplexity redan i maj 2024. Istället för att efterkomma, hävdar Reddit, ökade Perplexitys användning av dess innehåll, med citeringar som ökade fyrtiofaldigt.

Att namnge SerpApi, Oxylabs och AWMProxy som medkonspiratorer, innebär att de tillhandahåller anklagare för att anklaga lagarna. Den beskriver AWMProxy med särskild stränghet, med hänvisning till utredningsarbete som länkar det till det”tidigare ryska botnätet”Glupteba.

stagger.

bild av operationens omfattning; Reddit hävdar att under en enda tvåveckorsperiod i juli 2025 fick skrapföretagen olagligt åtkomst till nästan tre miljarder Googles söksidor som innehöll dess innehåll.

Reddits juridiska chef, Ben Lee, sa:”Perplexity är en villig kund till minst en av dessa skrapor, som väljer att köpa ett stulent datanamn i stället för att ingå ett lagligt namn med Reddit.”

åtalade har kraftfullt förnekade anklagelserna. I ett uttalande sa Perplexitys kommunikationschef, Jesse Dwyer,”Vårt tillvägagångssätt förblir principiellt och ansvarsfullt eftersom vi tillhandahåller sakliga svar med korrekt AI, och vi kommer inte att tolerera hot mot öppenhet och allmänhetens intresse.”

Ryan Schafer, en direktör på SerpApi, sa till Adweek,”Vi håller starkt oense med Reddits avsikter och försvarar oss själva med påståenden domstol.”

Oxylabs Chief Governance and Strategy Officer, Denas Grybauskas, upprepade detta och sa att företaget”inte kommer att tveka att försvara sig mot dessa anklagelser”.

För Perplexity är det inte första gången det möter sådana anklagelser. AI-företaget kämpar redan mot stämningar från stora utgivare, inklusive News Corp, Encyclopedia Britannica och Merriam Webster.

Det anklagades också offentligt av webbsäkerhetsföretaget Cloudflare för att använda”stealth-crawlers”för att kringgå webbplatsregler och skrapa innehåll från webbplatser som uttryckligen hade förbjudit det.

This legal challenge from växande lista, vilket sätter Perplexitys datainsamlingsmetoder under intensiv granskning.

Reddit stämmer förvirring och dataskrapor för AI-innehållsstöld i”industriell skala”

Published by All Things Windows on October 23, 2025

Protecting the Crown Jewels: Reddit’s Two-Pronged Data Strategy

Perplexity in the Crosshairs: A Pattern of Publisher Conflict

IT Info

Meta tar med”Restyle”AI-redigering till Instagram-berättelser, återupplivar integritetsdebatter

IT Info

Google och Anthropic Solidify”Tens of Billions”Cloud Deal

IT Info

Intel överträffar förväntningarna för tredje kvartalet med intäkter på 13,7 miljarder dollar, men vändning i gjuteri med höga insatser väntar

Reddit stämmer förvirring och dataskrapor för AI-innehållsstöld i”industriell skala”

Published by All Things Windows on October 23, 2025

Protecting the Crown Jewels: Reddit’s Two-Pronged Data Strategy

Perplexity in the Crosshairs: A Pattern of Publisher Conflict

Related Posts

IT Info

Meta tar med”Restyle”AI-redigering till Instagram-berättelser, återupplivar integritetsdebatter

IT Info

Google och Anthropic Solidify”Tens of Billions”Cloud Deal

IT Info

Intel överträffar förväntningarna för tredje kvartalet med intäkter på 13,7 miljarder dollar, men vändning i gjuteri med höga insatser väntar