中國人工智能實驗室DeepSeek在其培訓數據上面臨新的問題。人們已經猜測,其新的R1-0528模型使用了Google的雙子座AI進行培訓。這是從3月開始的早期指控,內容涉及Openai的Chatgpt的出現。正如TechCrunch報導的那樣,最近的說法源於研究人員指出相似之處。他們觀察到了新的DeepSeek模型的語言,並且內部“痕跡”與Google的Gemini 2.5 Pro。
使用DeepSeek的最新模型,關於AI倫理和知識產權的辯論再次加劇。在訓練期間,模型從其他模型中學習的“蒸餾”實踐對此至關重要。如果經過證實,DeepSeek可能會面臨法律和聲譽問題。這樣的結果還將質疑AI少校實驗室的保障措施的功效。這種情況凸顯了美國與中國之間激烈的AI競爭,也可能影響用戶信任。
開發商Sam Paeach和SpeechMap的創建者對當前的擔憂進行了放大。他們指出了風格和結構上的相似之處。雖然不是結論性的,但這與過去的事件相呼應。 例如,應要求,DeepSeek的V3模型有時將自己確定為Chatgpt。
A Pattern Of Accusations
Allegations of improper data use by DeepSeek are not new. 2025年早些時候,Openai找到了將DeepSeek與蒸餾聯繫起來的證據。 Around the same time, Microsoft reportedly detected significant data exfiltration via OpenAI developer accounts, which OpenAI suspected were tied to DeepSeek, as per 彭博社。 Openai的術語明確禁止使用其輸出來建立競爭對手AI。
進一步加強了這些擔憂,一項研究發現,DeepSeek R1與Chatgpt共享了其74.2%的寫作方式。但是,DeepSeek表示其R1模型是從V3模型開發的。該公司聲稱V3使用了內部合成數據和第三方開源信息,而不是Direct OpenAi產出。
DeepSeek描述了5月下旬推出的R1-0528型號,是“次要試用升級”。然而,在其擁抱的麵條頁面,該公司將模型定位為“接近o3和pegini 2.5 proy的領先模型的領先模型”。向這種高級AI學習的動機。 The R1-0528 model, utilizing a Mixture-of-Experts (MoE) architecture, was promoted for significant enhancements in reasoning, mathematics, and programming.
Challenges In Proving Distillation
AI training on newwe data faces one major constraint: The AI industry grapples with “AI slop”—web content increasingly generated by 人工智能。這可能會導致模型無意間發展相似的特徵。但是,一些專家發現有意的蒸餾可比性。
AI研究人員Nathan Lambert Ingration Ingration Ingration of x
響應這些風險,主要的AI公司正在增強安全性。 Openai於4月開始ID驗證。 Google已開始“總結”通過其AI Studio開發人員平台可用的模型生成的痕跡。同樣,五月的擬人化也表示,它將開始總結自己的模型的痕跡,理由是要保護其“競爭優勢”,正如TechCrunch所報導的。
地緣政治和監管環境
deepseek的進度在地理上是巨大的。美國CCP的一個眾議院選擇委員會將DeepSeek標記為國家安全風險。委員會主席John Moolenaar斷言:“ DeepSeek不僅是另一個AI應用程序,而且是中國共產黨的武器庫中的一種武器,旨在監視美國人,竊取我們的技術並顛覆美國法律。” 這種審查增加了有關DeepSeek R1事實準確性和安全性問題的先前報告。
該公司強調了計算效率,部分原因是美國對高級NVIDIA GPU的出口控制。這一重點還導致了中國競爭對手Tencent,他也正在開發自己的AI模型,他在2024年末使用DeepSeek模型進行GPU優化。
到目前為止,DeepSeek繼續其快速發展。 The latest R1-0528 model is available under an MIT License, permitting commercial use and distillation, and DeepSeek’s next-generation R2 model is expected to be released soon.