Chińskie laboratorium AI Deepseek stoi w obliczu nowych pytań dotyczących swoich danych szkoleniowych. Okazało się, że jego nowy model R1-0528 wykorzystał Google Gemini AI do szkolenia. Następuje wcześniejsze oskarżenia z marca dotyczące całego wykorzystania wyników z Chatgpt Openai. Ostatnie twierdzenia, jak donosi TechCrunch, wynikają z badaczy odnotowanych podobieństwem. Obserwowali język nowego modelu Deepseek, a wewnętrzne „ślady” przypominają Google’s Gemini 2.5 Pro.
z najnowszym modelem Deepseeka, debatami na temat etyki AI i własności intelektualnej ponownie nasila się. Praktyka „destylacji”, w której modele uczą się z innego modelu podczas szkolenia, ma kluczowe znaczenie. Jeśli zostanie udowodniony, Deepseek może stawić czoła kwestiom prawnym i reputacyjnym. Takie wyniki zakwestionowałyby również skuteczność zabezpieczeń przez Major AI Labs. Sytuacja podkreśla zaciętą konkurencję AI między USA a Chinami, a także może wpływać na zaufanie użytkowników.
Obecne obawy zostały wzmocnione przez programistów Sam Paeach i twórcę mowy. Wskazali na podobieństwa stylistyczne i strukturalne. Choć nie jest rozstrzygające, przypomina to przeszłe incydenty. Na przykład na żądanie model V3 Deepseek czasami identyfikował się jako Chatgpt.
Wzór oskarżeń
zarzuty stosowania danych Improper przez Deepseek nie są nowością nowości. Wcześniej w 2025 r. Openai znalazł dowody łączące Deepeek z destylacją. Mniej więcej w tym samym czasie Microsoft podobno wykrył znaczącą exfiltrację danych za pośrednictwem kont developerów OpenAI, które podejrzewano, że Openai były powiązane z Deepseek, zgodnie z Bloomberg . Warunki Openai wyraźnie zabraniają wykorzystywania swoich wyników do budowy rywalizującej AI.
Rozpierając te obawy, badanie wykazało, że Deepseek R1 podzielił 74,2% stylu pisania z Chatgpt. Deepseek stwierdził jednak, że jego model R1 został opracowany z modelu V3. Firma twierdziła, że V3 wykorzystała wewnętrzne dane syntetyczne i informacje otwartej strony zewnętrznej, a nie bezpośrednie wyjścia Openai.
Deepseek opisał model R1-0528, uruchomiony pod koniec maja jako „drobne ulepszenie próbne”. Jednak na jej strona przytulania , firma ustawiła model jako „zbliżając się do wiodących modeli, takich jak O3 i Gemini 2.5 Pro.”
to oświadczenie o wiodącym systemie, takim jak Gemin. Potencjalny motyw uczenia się z tak zaawansowanej sztucznej inteligencji. Model R1-0528, wykorzystujący architekturę mieszanki ekspertów (MOE), został promowany pod kątem znacznych ulepszeń w rozumowaniu, matematyce i programowaniu.
Wyzwania związane z udowodnieniem destylacji
Szkolenie AI na temat danych o nowości. Ai. Może to prowadzić do niezamierzonego opracowania podobnych cech. Jednak niektórzy eksperci uważają celową destylację.
badacz AI Nathan Lambert sugerowane na x , „Gdybym był Deepseek, zdecydowanie stworzyłbym tonę syntetyczną z danych najlepiej od danych z synów synchety. Model „zauważając, że Deepseek jest„ [Deepseek] na GPU i spłukiwanie gotówką. Często sprowadza się to do analizy wzorców wyjściowych, które mogą być sugestywne, ale rzadko same rozstrzygające. Linia zaciera się między bezpośrednim destylacją a wpływem pośredniego, gdy modele są przeszkolone w zakresie danych w skali internetowej coraz częściej wypełnionymi wynikami innych zaawansowanych AIS. Konwergencja stylistyczna jest do pewnego stopnia prawie nieunikniona.
W odpowiedzi na te ryzyko główne firmy AI zwiększają bezpieczeństwo. Openai rozpoczął weryfikację ID w kwietniu. Google zaczął „podsumować” ślady generowane przez modele dostępne za pośrednictwem platformy programistów AI Studio. Podobnie, antropic in May powiedział również, że zacznie podsumować ślady własnego modelu, powołując się na potrzebę ochrony jego „korzyści konkurencyjnych”, jak donosi Techcrunch.
krajobraz geopolityczny i regulacyjny
występuje w przypadku uzasadnionych powłok geopolitycznych. Komitet Wyboru Izby Stanów Zjednoczonych w sprawie CCP uznał Deepseek zagrożenie dla bezpieczeństwa narodowego. Przewodniczący komitetu John Moolenaar stwierdził: „Deepseek to nie tylko kolejna aplikacja AI-jest bronią w arsenalu chińskiej partii komunistycznej, zaprojektowanej do szpiegowania Amerykanów, kradzieży naszej technologii i obalenia prawa USA”. Ta kontrola zwiększa wcześniejsze raporty dotyczące faktycznych dokładności i bezpieczeństwa DeepSeek R1.
Firma podkreśliła wydajność obliczeniową, częściowo z powodu kontroli eksportu w USA na zaawansowanych procesorach graficznych NVIDIA. Koncentracja to również doprowadziła Tencent, chińskiego konkurenta, który opracowuje również własne modele AI, do korzystania z modeli Deepseek pod koniec 2024 r. Do optymalizacji GPU.
Na razie Deepseek kontynuuje szybki rozwój. Najnowszy model R1-0528 jest dostępny pod licencja MIT , Umożliwiając komercyjne użycie i distillację, a Model R2 Deepseek ma zostać wydany wkrótce.