Laboratorul AI al lui Huawei se îndreaptă înapoi împotriva acuzațiilor de plagiat de la un grup de cercetare numit Onexnagi. Grupul a susținut vineri că noul model Pangu Pro AI al lui Huawei este o copie a modelului QWEN 2.5 al Alibaba. Într-o declarație de sâmbătă, 7 iulie, laboratorul Noah Ark de la Huawei a negat acuzația, Sutând modelul său dezvoltat independent . Concurența intensă și proprietatea intelectuală se luptă în industria AI în plină expansiune a Chinei. În calitate de giganți tehnologici locali pentru dominare pe fondul sancțiunilor din SUA, integritatea modelelor lor fundamentale vine sub control intens din partea comunității globale open-source.

Controversa a izbucnit pe 6 iulie, când un grup care se numește onendagi a publicat un raport acum eliminat pe Github (disponibil prin Web Archive) . Documentul susține că modelul Pan Moe Pro Moe al lui Huawei, recent deschis, nu este o creație originală, ci o versiune „upcycled” a modelului QWEN 2.5 14B al rivalului Alibaba.

O „amprentă” a plagiatului?

afirmația centrală a lui Honendagi se bazează pe o nouă tehnică de „amprentare”. Metoda analizează modelele de abatere standard ale matricilor parametrilor de atenție (Q, K, V, O) pe straturile unui model. Cercetătorii susțin că aceste modele sunt o proprietate intrinsecă a arhitecturii și istoriei de instruire a unui model.

Această analiză a relevat ceea ce lucrarea numește o „corelație extraordinară” de 0,927 între Pangu și Qwen. Onestagi susține că această amprentă statistică este suficient de robustă pentru a supraviețui antrenamentului continuu, o tehnică comună care poate șterge filigranele tradiționale dintr-un model furat.

Graficele de analiză a corelației de la Honendagi

​​pentru a-și consolida cazul, grupul a indicat asemănări arhitecturale suplimentare. Ei au evidențiat modele aproape identice în proiecțiile de prejudecăți QKV și greutățile de atenție. Cercetătorii au descoperit chiar un fișier de licență QWEN în Depozitul oficial de cod al Pangu pe Gitcode . Onestagi și-a încheiat lucrarea afirmând: „Toate aceste puncte sunt coincidențe? Probabil că nu. Prin normalizarea acestor valori de abatere standard pe toate straturile, ele creează o semnătură distinctivă capabilă să identifice linia unui model chiar și după modificări semnificative, cum ar fi antrenamentul continuu.

pentru a-și consolida afirmația principală, cercetătorii au indicat o cascadă de dovezi coroborate. Ei au subliniat că modelele de prejudecată QKV din PAGU au fost o potrivire aproape perfectă pentru QWEN 2.5. Aceștia au numit acest lucru deosebit de „nenorocit”, susțin ei, deoarece prejudecata QKV a fost o caracteristică distinctivă a modelelor QWEN timpurii, care de atunci a fost abandonată de majoritatea proiectelor open-source, inclusiv propriul QWEN3 al Alibaba. Grupul a remarcat că investigația lor este în desfășurare, analiza inițială a activărilor modelului arătând, de asemenea, suprapuneri substanțiale.

Grupul a contestat direct noțiunea de coincidență, argumentând numărul mare de trăsături suprapuse indică o copie deliberată. They also claimed to have received statements from multiple whistleblower that supported their hypothesis:

“We received messages from multiple whistleblowers (claimed to be) in their team. They confirmed the accusation towards Pangu Pro MoE and also confirmed that there exists a version of Pangu Ultra MoE that is “very similar”to DeepSeek-V3 (still upcycling, but in other ways, which matches the information provided by issues 2 și 4). Pe 7 iulie, Noah Ark Lab a lansat o declarație care afirmă că modelul Pangu a fost „… nu se bazează pe pregătirea incrementală a modelelor altor producători…” și a fost dezvoltat independent de la sol. Laboratorul a subliniat că modelul a fost construit în întregime pe proprietarul Chips AI Ascend AI al lui Huawei.

în timp ce a recunoscut utilizarea unui cod open-source terț, declarația lui Huawei a subliniat că echipa sa de dezvoltare a respectat strict toate cerințele de licențiere. Negarea încadrează modelul Pangu ca o parte cheie a strategiei sale de încredere în sine, nu a unei lucrări derivate.

un „război” AI într-un ecosistem sancționat

Această confruntare a proprietății intelectuale se desfășoară la doar câteva zile după ce Huawei a făcut un pivot strategic major. Pe 2 iulie, compania și-a aprovizionat modelele Pangu, o mișcare interpretată pe scară largă ca un efort de a construi un ecosistem software captiv în jurul hardware-ului său.

Această strategie își propune să conducă vânzările acceleratoarelor AI ascendente, creând o stivă tehnologică autosuficientă pentru a contracara sancțiunile din SUA. După cum a menționat Mark Einstein de la Contropoint, „Obiectivul său este să folosească în cele din urmă produse open source pentru a conduce vânzări hardware, ceea ce este un model complet diferit de ceilalți”. Această abordare hardware este crucială pentru supraviețuirea și competitivitatea lui Huawei.

Incidentul subliniază concurența acerbă în sectorul AI al Chinei, denumit adesea un „război de o sută de modele”. Giganții tehnologici precum Alibaba, Baidu, iar acum Huawei își aprovizionează agresiv AI-ul principal pentru a capta dezvoltatorul Mindshare și dominanța pieței.

Această apăsare open-source este esențială, deoarece controalele de export din SUA au întrerupt efectiv firmele chineze de la NVIDIA GPU. Vidul hardware rezultat a făcut din Chips-ul ascensor al lui Huawei o alternativă vitală pentru dezvoltatorii autohtoni.

Paul Triolo din Albright Stonebridge Group a prezis că bordurile din SUA „… va însemna că GPU-ul Huawei 910C va deveni acum hardware-ul la alegere pentru (chineză) modele de dezvoltatori și pentru deplarea capacității de defectare a hardware-ului”. Acuzația, probabil dovedită sau nu, complică ambițiile lui Huawei. Ridică întrebări despre transparență și încredere într-un moment în care compania încearcă să se poziționeze ca campion național în AI. Așa cum a spus Honenagi, într-o epocă în care „continuarea antrenamentului nu este tot ce ai nevoie pentru a fura un model”, metodele robuste pentru verificarea provenienței modelului devin esențiale pentru concurența echitabilă.

Categories: IT Info