L’IA Lab di

​​Huawei sta respingendo le accuse di plagio di un gruppo di ricerca chiamato HonesTagi. Venerdì il gruppo ha affermato che il nuovo modello Pangu Pro Ai di Huawei è una copia del modello Qwen 2.5 di Alibaba. In una dichiarazione di sabato 7 luglio, Noah Ark Lab di Huawei ha negato l’accusa, è stato sviluppato il modello indipendente Intense concorrenza e battaglie di proprietà intellettuale all’interno del settore dell’intelligenza artificiale in piena cinese. Mentre i giganti della tecnologia locale corrono per il dominio tra le sanzioni statunitensi, l’integrità dei loro modelli fondamentali sta arrivando a un intenso controllo della comunità globale open source.

La controversia è scoppiata il 6 luglio quando un gruppo che si chiama Honesagi pubblicato un rapporto ora rimosso su Github (disponibile tramite Web Archive) . Il documento sostiene che il modello Pangu Pro Moe recentemente aperto di Huawei non è una creazione originale ma una versione”Upcyccle”del modello Qwen 2.5 14b di Alibaba.

Una”impronta digitale”del plagio?

L’affermazione centrale di Honeyagi si basa su una nuova tecnica”impronte digitali”. Il metodo analizza i modelli di deviazione standard delle matrici dei parametri di attenzione (Q, K, V, O) attraverso i livelli di un modello. I ricercatori sostengono che questi schemi sono una proprietà intrinseca dell’architettura e della storia della formazione di un modello.

Questa analisi ha rivelato ciò che il documento chiama una”straordinaria correlazione”di 0,927 tra Pangu e Qwen. HoneyGi sostiene che questa impronta digitale statistica è abbastanza robusta per sopravvivere ad addestramento continuo, una tecnica comune che può cancellare le filigrane tradizionali da un modello rubato.

Grafici di analisi di correlazione da Honeyagi

​​per rafforzare il suo caso, il gruppo ha puntato a ulteriori somiglianze architettoniche. Hanno messo in evidenza modelli quasi identici nelle proiezioni di distorsione QKV e nei pesi a layernorm. I ricercatori hanno persino scoperto un file di licenza Qwen all’interno di repository di codice ufficiale di Pangu su gitcode . Honesagi ha concluso il suo documento affermando:”Tutti questi punti sono coincidenze? Probabilmente no.”

Secondo i ricercatori, questi modelli unici emergono naturalmente dall’architettura fondamentale di un modello e possono essere calcolati con una funzione di base, torcia.std (), applicati alle matrici dei parametri. Normalizzando questi valori di deviazione standard in tutti i livelli, creano una firma distintiva in grado di identificare il lignaggio di un modello anche dopo modifiche significative come la formazione continua.

Per rafforzare la loro pretesa principale, i ricercatori hanno indicato una cascata di prove corroboranti. Hanno evidenziato che i modelli di bias di QKV in Pangu erano una corrispondenza quasi perfetta per Qwen 2.5. Hanno chiamato questo in particolare”dannosi”, sostengono, perché il pregiudizio di QKV era una caratteristica distintiva dei primi modelli Qwen che da allora è stato abbandonato dalla maggior parte dei progetti open source, tra cui il nuovo Qwen3 di Alibaba. Il gruppo ha osservato che la loro indagine è in corso, con l’analisi iniziale delle attivazioni del modello che mostra anche una sostanziale sovrapposizione.

Il gruppo ha sfidato direttamente la nozione di coincidenza, sostenendo il numero puro di tratti sovrapposti a una copia deliberata. They also claimed to have received statements from multiple whistleblower that supported their hypothesis:

“We received messages from multiple whistleblowers (claimed to be) in their team. They confirmed the accusation towards Pangu Pro MoE and also confirmed that there exists a version of Pangu Ultra MoE that is “very similar”to DeepSeek-V3 (still upcycling, but in other ways, which matches the information provided by issues 2 e 4) Tuttavia, questi messaggi non sono verificabili perché Pangu Ultra Moe non è rilasciato e non siamo in grado di confermare le identità di questi informatori.”

La ferma negazione di Huawei

Huawei ha pubblicato uno swift e Il 7 luglio, il suo laboratorio di Noah Ark ha rilasciato una dichiarazione che affermava che il modello Pangu era”… non basato sull’addestramento incrementale di modelli di altri produttori…”ed è stato sviluppato indipendentemente da zero. Il laboratorio ha sottolineato che il modello è stato interamente costruito sui chip di AI di AI di Huawei.

Riconando l’uso di un codice open source di terze parti, la dichiarazione di Huawei ha sottolineato che il suo team di sviluppo ha aderito rigorosamente a tutti i requisiti di licenza. La negazione incornicia il modello Pangu come una parte fondamentale della sua strategia di autosufficienza, non un’opera derivata.

Una”guerra”di AI in un ecosistema sanzionato

Questo scontro di proprietà intellettuale si stabilisce solo giorni dopo che Huawei ha fatto un importante punto strategico. Il 2 luglio, la società ha aperto i suoi modelli Pangu, una mossa ampiamente interpretata come uno sforzo per costruire un ecosistema software in cattività attorno al suo hardware.

Questa strategia mira a guidare le vendite dei suoi acceleratori di AI ascendi, creando uno stack tecnologico autosufficiente per contrastare le sanzioni statunitensi. Come ha osservato Mark Einstein di Counterpoint,”Il suo obiettivo è in definitiva utilizzare prodotti open source per guidare le vendite di hardware, che è un modello completamente diverso dagli altri”. Questo approccio hardware-primo è cruciale per la sopravvivenza e la competitività di Huawei.

L’incidente sottolinea la forte concorrenza nel settore dell’IA in Cina, spesso soprannominata una”guerra di cento modelli”. I giganti tecnologici come Alibaba, Baidu e ora Huawei stanno aggressivamente open-sourcing della loro INA principale per catturare lo sviluppatore Mindshare e il dominio del mercato. Il vuoto hardware risultante ha reso i chip di Ascend di Huawei un’alternativa vitale per gli sviluppatori domestici.

Paul Triolo di Albright Stonebridge Group ha predetto che i cordoli statunitensi”… Significano che la capacità di devastazione di Huawei

L’accusa, dimostrata o no, complica le ambizioni di Huawei. Solleva domande sulla trasparenza e sulla fiducia in un momento in cui la società sta cercando di posizionarsi come campione nazionale in AI. Come ha detto Honesagi, in un’epoca in cui”Continua la formazione non è tutto ciò di cui hai bisogno per rubare un modello”, i metodi robusti per verificare la provenienza del modello stanno diventando essenziali per una concorrenza equa.

Categories: IT Info