Laboratorium AI Huawei odpycha się przeciwko oskarżeniom o plagiat grupy badawczej o nazwie Fairlygi. Grupa twierdziła w piątek, że nowy model AI Pro AI Huawei jest kopią modelu Qwen 2.5 Alibaba. W oświadczeniu z soboty, 7 lipca, laboratorium Huawei Noah Ark zaprzeczyło zarzutowi, .
Kontrowersje wybuchły 6 lipca href=”https://web.archive.org/web/20250704010101/https://github.com/honestagi/llm-fingerprint”target=”_ blank”> opublikował usunięty teraz raport na GitHub (dostępny za pośrednictwem archiwum internetowego) . Dokument twierdzi, że niedawno otwarty model Huawei Pro MOE nie jest oryginalnym dziełem, ale „upcyklingowaną” wersją rywalizującego modelu Qwen 2.5 14b.
„odcisk palca” plagiatu?
Centralne roszczenie uczciwości opiera się na nowatorskiej technice „odcisku palców”. Metoda analizuje wzorce odchylenia standardowego macierzy parametrów uwagi (Q, K, V, O) w warstwach modelu. Naukowcy twierdzą, że te wzorce są wewnętrzną właściwością architektury i historii treningu modelu.
Ta analiza ujawniła, co artykuł nazywa „niezwykłą korelacją” 0,927 między Pangu i Qwen. Uczciwość twierdzi, że ten statystyczny odcisk palca jest wystarczająco solidny, aby przetrwać ciągłe trening, wspólną technikę, która może wymazać tradycyjne znaki wodne z skradzionego modelu.
Analiza korelacji z Forecregi
, aby wzmocnić jej przypadek, grupa wskazała na dodatkowe podobieństwa architektoniczne. Podkreślili prawie identyczne wzorce w projekcjach stronniczości QKV i ciężarach warstwowych uwagi. Naukowcy odkryli nawet plik licencji QWEN w Oficjalne repozytorium kodu Pangu na gitcode . Uczciwościagi podsumował swój artykuł stwierdzając: „Wszystkie te punkty są zbiegów okoliczności? Prawdopodobnie nie.”
Według naukowców te unikalne wzorce wynikają naturalnie z podstawowej architektury modelu i można je obliczyć za pomocą podstawowej funkcji, Torch.std (), zastosowanej do matryc parametrów. Normalizując te wartości odchylenia standardowego we wszystkich warstwach, tworzą charakterystyczny podpis zdolny do zidentyfikowania linii modelu nawet po znacznych modyfikacjach, takich jak dalsze szkolenie.
W celu wzmocnienia ich podstawowego twierdzenia, naukowcy wskazali na kaskadę potwierdzających dowodów. Podkreślili, że wzory stronniczości QKV w Pangu były prawie idealne dopasowanie do QWEN 2.5. Argumentują, że nazywali to szczególnie „potępiającymi”, ponieważ stronniczość QKV była charakterystyczną cechą wczesnych modeli QWen, które od tego czasu zostały porzucone przez większość projektów typu open source, w tym nowszy QWen3 w Alibaba. Grupa zauważyła, że ich badanie trwa, a początkowa analiza aktywacji modelu wykazuje również znaczne nakładanie się.
Grupa bezpośrednio zakwestionowała pojęcie zbieżności, argumentując, że liczba nakładających się cech wskazuje na celową kopię. Twierdzili również, że otrzymali oświadczenia od wielu informatorów, które poparły ich hipotezę:
„Otrzymaliśmy wiadomości od wielu demaskatorów (twierdzących) w swoim zespole. Potwierdzili oskarżenie wobec Pangu Pro Moe, a także potwierdzili, że istnieje wersja Pangu Ultra Moe, która jest„ bardzo podobna “do Deepseek-3 (wciąż uparcia się, ale w innych sposób, które dopasowują informacje, które dostarczają informacji, dostarczoną przez emeryturę. 2 i 4). 7 lipca jego laboratorium Noah Ark wydało oświadczenie, w którym stwierdzono, że model Pangu brzmiał „… nie oparty na przyrostowym szkoleniu modeli innych producentów…” i został niezależnie opracowany od podstaw. Laboratorium podkreśliło, że model został całkowicie zbudowany na własnych zastrzeżonych układach AI Huawei.
, potwierdzając użycie kodu open source, oświadczenie Huawei podkreśliło, że jego zespół programistyczny ściśle przestrzegał wszystkich wymagań licencjonowania. Zaprzeczenie określa model Pangu jako kluczową część jego strategii samowystarczalności, a nie prace pochodne.
Ai „wojna” w sankcjonowanym ekosystemie
To starcie własności intelektualnej rozwija się zaledwie kilka dni po tym, jak Huawei dokonał znacznego strategicznego piwa. 2 lipca firma opętała otwarcie modeli Pangu, ruch powszechnie interpretowany jako próba zbudowania ekosystemu oprogramowania w niewoli wokół jego sprzętu.
Ta strategia ma na celu zwiększenie posesji AI akceleratorów, tworząc samowystarczalny stos technologii, aby przeciwdziałać karnym sankcjom w USA. Jak zauważył Mark Einstein z Contricoint, „jego celem jest ostateczne wykorzystanie produktów typu open source do napędzania sprzedaży sprzętowej, co jest zupełnie innym modelem od innych”. To najpierw podejście ma kluczowe znaczenie dla przetrwania i konkurencyjności Huawei.
Incydent podkreśla zaciętą konkurencję w chińskim sektorze AI, często nazywaną „wojną setki modeli”. Giganci technologiczni tacy jak Alibaba, Baidu, a teraz Huawei agresywnie otwartą openową swoją sztuczną inteligencję, aby uchwycić deweloper Mindshare i dominację rynku.
Ten pchnięcie open source ma kluczowe znaczenie, ponieważ kontrola eksportu w USA skutecznie odciąła chińskie firmy z najwyższego poziomu Nvidia GPU. Powstała próżnia sprzętowa sprawiła, że wzniesione układy Huawei stały się istotną alternatywą dla deweloperów krajowych.
Paul Triolo z grupy Albright Stonebridge przewidywał, że krawężniki w USA „… będzie oznaczało, że ASCEND HUAWEI 910C GPU stanie się teraz trudnym wyborem dla (chińskich) deweloperów modelu (chińskiego), a dla wdrażania. Niezależnie od tego, czy jest to udowodnione, czy nie, komplikuje ambicje Huawei. Rodzi pytań o przejrzystość i zaufanie w momencie, gdy firma stara się pozycjonować się jako mistrz krajowy w sztucznej inteligencji. Jak ujął to uczciwość, w erze, w której „kontynuowanie treningu to nie wszystko, czego potrzebujesz do kradzieży modelu”, solidne metody weryfikacji proweniencji stają się niezbędne do uczciwej konkurencji.