Reddit於6月4日發起了針對人工智能創業人擬人化的訴訟,指控AI公司非法使用其龐大的用戶生成的內容來培訓像Claude這樣的AI模型。該訴訟於舊金山縣加利福尼亞高等法院提起主張。 Reddit在沒有許可協議的情況下主張人類系統刮擦的數據,直接從平台的內容中獲利,同時違反其服務條款。
此法律措施突出了內容平台和AI開發人員之間在使用在線數據的使用方面的張力。雷迪特(Reddit)認為,即使聲稱已經停止停止後,擬人化也以道德AI的領導者的身份,繼續進行數據收集。
訴訟特別值得注意,因為Reddit已與其他主要AI實體建立了付費數據許可經銷,包括與OpenAI和Google的伙伴關係,並設置了先例的人類忽略。結果可能會極大地影響AI公司如何訪問公共在線數據以及平台如何在保護用戶隱私的同時獲得貨幣貨幣。濫用
Reddit提出的法律投訴詳細介紹了一種擬人化的未經授權數據訪問的模式,可追溯到至少2021年12月。 Reddit的文件斷言“實際上,Anthropic實際上是故意對Reddit用戶的個人數據培訓的未經要求的人的個人數據進行了培訓。” 投訴進一步辯稱,擬人化無視Reddit的Robots.txt指令,該指令旨在指導網絡爬網。
訴訟中的關鍵點是指責歪曲。 Reddit聲稱,在2024年7月,在Reddit關於數據濫用的公開聲明之後,人道公開表示它阻止了機器人訪問Reddit。
,但是,投訴稱這是不真實的:“ Anthropic的機器人繼續擊中Reddit的一千千萬次。”這直接與擬人發言人對Verge
雷迪特(Reddit)的法律申請呼叫此較早的陳述“ false”,並以審計記錄為持續訪問的證據。 The lawsuit refers to on a 2021 Anthropic research paper, which detailed the utility of Reddit data for AI model training, as evidence of Anthropic’s long-standing intent.
Reddit’s Stance on Data Monetization and Control
Reddit’s legal action against Anthropic underscores its increasingly assertive stance on controlling and monetizing its valuable用戶生成的內容。首席執行官史蒂夫·霍夫曼(Steve Huffman)反復強調了Reddit數據在AI培訓中的獨特價值,並指出:“ AI模型需要人類知識,Reddit的內容充滿了它。”
在Wall Street Journal Journal Tech Live活動中,他說,這種立場是由他說的。
為了保護其數據,Reddit在2024年5月實施了新的公共內容策略,為商業數據使用制定了明確的規則。接下來是對其機器人的更新。 TXT文件於2024年7月,該文件限制了大多數Web爬網的訪問,但值得注意的例外,除了支付Google之類的合作夥伴。
Reddit認為其平台的開放性並不等於免費商業利用。該公司還積極解決其平台上與AI相關的問題,包括在有爭議的和未經授權的AI實驗之後對用戶驗證過程進行大修。
更廣泛的含義對AI行業
訴訟的行業的範圍更廣泛,以競爭臨界行業,以競爭臨時範圍。版權和道德AI發展。此案還引起了眾人矚目的焦點,該案件在2月收於35億美元的資金回合,對該公司的估值約為615億美元。這種財務背景為Reddit的不公正富集的主張增加了權重。
reddit本身是AI領域的積極參與者,他啟動了自己的AI驅動搜索工具,Reddit答案,通過與Google Cloud和Openai的伙伴關係開發。這表明Reddit的問題不是AI技術本身,而是其未經補償和未經授權的使用。 Reddit和Anthropic之間的法律鬥爭有望成為具有里程碑意義的案例,有可能塑造AI數據治理的未來格局和AI公司的責任。