Reddit zainicjował pozew przeciwko sztucznej inteligencji antropic w dniu 4 czerwca, twierdząc, że firma AI bezprawnie wykorzystała swoją ogromną treść generowaną przez użytkowników do szkolenia modeli AI, takich jak Claude. Pozew, złożony w kalifornijskim sądzie Najwyższym w hrabstwie San Francisco legalna skarga . inne roszczenia. Reddit twierdzi, że antropowe systematycznie zeskrobane dane bez umowy licencyjnej, bezpośrednio czerpiąc z treści platformy, jednocześnie lekceważy jej warunki usług.

To działanie prawne podkreśla eskalacyjne napięcie między platformami treści a programistami AI w zakresie korzystania z danych online. Reddit twierdzi, że antropiczny, który przedstawia się jako etyczny lider AI, kontynuował zbieranie danych nawet po tym, jak zatrzymał się.

Pozew jest szczególnie godny uwagi, ponieważ Reddit ustalił płatne umowy licencjonowania danych z innymi głównymi podmiotami AI, w tym partnerstwem z Openai i Google, ustanawiając precedensowe antropicznie zignorowane. Wynik może znacząco wpłynąć na to, w jaki sposób firmy AI uzyskują dostęp do publicznych danych online i jak platformy zarabiają na treści, jednocześnie chroniąc prywatność użytkowników.

decice i content DaneSus

Skarga prawna złożona przez Reddita opisuje wzór domniemanego nieautoryzowanego dostępu do danych przez antropijne pochodzące od co najmniej grudnia 2021 r.. Zgłoszenie Reddita twierdzi, że „antropic jest w rzeczywistości celowo przeszkolony w zakresie osobistych danych użytkowników Reddit, bez żądania ich zgody”. Skarga twierdzi ponadto, że antropijne pominięte przez Reddit’s Robots.txt, które zostały zaprojektowane tak, aby poprowadzić obsadzenie internetowe.

Kluczowym punktem procesu jest oskarżenie o wprowadzenie w błąd. Reddit twierdzi, że w lipcu 2024 r., Po publicznych oświadczeniach Reddit o niewłaściwym użyciu danych, antropijnie publicznie stwierdził, że zablokował swoje boty dostęp do Reddit.

Jednak skarga twierdzi, że nie było to nieprawdziwe: „Boty antropiczne nadal uderzały w serwery Reddit ponad set tysiące razy”. To bezpośrednio jest sprzeczne z oświadczeniem, które rzecznik antropiczny złożył Verge w lipcu 2024 . Według dyrektora generalnego Reddit Steve’a Huffmana, Reddit był na swojej liście bloków Web Crawler od połowy 2024 roku.

Zgłoszenie prawne Reddit nazywa to wcześniejsze oświadczenie „Fałsz”, powołując się na dzienniki audytu jako dowód dalszego dostępu. Pozew odnosi się do antropijnego dokumentu badawczego z 2021 r., Który szczegółowo opisał użyteczność danych Reddit dla szkolenia modelu AI, jako dowód długotrwałych zamiarów antropiu.

Reddit postawy w sprawie monetyzacji danych i kontroli

Reddit. Treść generowana przez użytkowników. Dyrektor generalny Steve Huffman wielokrotnie podkreślił unikalną wartość danych Reddita do szkolenia AI, zauważając: „Modele AI potrzebują ludzkiej wiedzy, a treść Reddit jest jej pełna.”

To stanowisko zostało wzmocnione jego komentarzami na wydarzeniu na żywo z Wall Street Journal, gdzie powiedział: „AI musi pochodzić z AI. Reddit.”

Aby chronić swoje dane, Reddit wdrożył publiczną zasadę treści w maju 2024 r. Nowe zasady treści publicznej, ustalając jasne zasady używania danych komercyjnych. Następnie nastąpiła aktualizacja pliku Robots.txt w lipcu 2024 r., Który ograniczył dostęp do większości obskurników internetowych, z godnymi uwagi wyjątkami dla płacących partnerów, takich jak Google.

Reddit utrzymuje, że otwartość jego platformy nie odpowiada bezpłatnej komercyjnej eksploatacji. Firma jest również proaktywna w rozwiązywaniu problemów związanych z AI na swojej platformie, w tym przegląd procesów weryfikacji użytkownika po kontrowersyjnym i nieautoryzowanym eksperymencie AI przez naukowców z University of Zurych.

Szersze implikacje dla branży AI

Występowanie w sprawie krytycznej w branży ai, podobnie jak debiaty zorganizowane przez branżę AI, prawa, zorganizowani przez branżę. Prawa autorskie i etyczny rozwój sztucznej inteligencji. Sprawa stawia również światło na antropiku, który w lutym zamknął rundę finansowania o wartości 3,5 miliarda dolarów, wyceniając firmę na około 61,5 miliarda dolarów. Ten kontekst finansowy dodaje wagi do twierdzeń Reddita o niesprawiedliwym wzbogaceniu.

sam Reddit jest aktywnym uczestnikiem przestrzeni AI, po uruchomieniu własnego narzędzia wyszukiwania zasilanego AI, Reddit Answers, opracowanymi przez partnerstwa z Google Cloud i OpenAI. To pokazuje, że problem Reddita nie dotyczy samej technologii AI, ale z niekompensowanym i nieautoryzowanym zastosowaniem. Legalna bitwa między Reddit a antropikiem może być przełomową sprawą, potencjalnie kształtującą przyszły krajobraz zarządzania danymi AI i obowiązkami firm AI.

Categories: IT Info