Le laboratoire AI de

Huawei repousse les accusations de plagiat d’un groupe de recherche appelé Honestagi. Le groupe a affirmé vendredi que le nouveau modèle Pangu Pro AI de Huawei est une copie du modèle QWEN 2.5 d’Alibaba. Dans une déclaration du samedi 7 juillet, le Noah Ark Lab de Huawei a nié la charge, . Une concurrence intense et des batailles de propriété intellectuelle dans l’industrie de l’IA en plein essor de la Chine. Alors que les géants de la technologie locaux se déroulent pour la domination au milieu des sanctions américaines, l’intégrité de leurs modèles fondamentaux est soumise à un examen minutieux de la communauté mondiale des open source.

La controverse a éclaté le 6 juillet lorsqu’un groupe s’appelait Honestagi a publié un rapport désormais supprimé sur GitHub (disponible via le Web Archive) . Le document allègue que le modèle Pangu Pro Moe récemment ouvert de Huawei n’est pas une création originale mais une version”Upcoycled”du modèle QWEN 2.5 14B de rival Alibaba.

une”empreinte digitale”du plagiat?

La revendication centrale de Honnoragi repose sur une nouvelle technique”d’empreinte digitale”. La méthode analyse les modèles d’écart type des matrices de paramètres d’attention (Q, K, V, O) sur les couches d’un modèle. Les chercheurs soutiennent que ces modèles sont une propriété intrinsèque de l’historique de l’architecture et de la formation d’un modèle.

Cette analyse a révélé ce que l’article appelle une «corrélation extraordinaire» de 0,927 entre Pangu et Qwen. Honestagi soutient que cette empreinte statistique est suffisamment robuste pour survivre à une formation continue, une technique commune qui peut effacer les filigranes traditionnels à partir d’un modèle volé.

Corrélation d’analyse des graphiques de Honestagi

​​pour renforcer son cas, le groupe a pointé des similitudes architecturales supplémentaires. Ils ont mis en évidence les modèles presque identiques dans les projections de biais QKV et les poids de tempête d’attention. Les chercheurs ont même découvert un fichier de licence Qwen dans Référentiel de code officiel de Pangu sur gitcode . Honestagi a conclu son article en déclarant:”Tous ces points sont des coïncidences? Probablement pas.”

Selon les chercheurs, ces modèles uniques émergent naturellement de l’architecture fondamentale d’un modèle et peuvent être calculés avec une fonction de base, Torch.std (), appliquée aux matrices de paramètres. En normalisant ces valeurs d’écart type à toutes les couches, ils créent une signature distinctive capable d’identifier la lignée d’un modèle même après des modifications significatives comme la formation continue.

Pour renforcer leur affirmation principale, les chercheurs ont souligné une cascade de preuves corroborantes. Ils ont souligné que les modèles de biais QKV dans Pangu étaient une correspondance presque parfaite pour QWEN 2.5. Ils ont appelé cela particulièrement «accablant», soutiennent-ils, car le biais QKV était une caractéristique distinctive des premiers modèles QWEN qui a depuis été abandonné par la plupart des projets open-source, notamment le nouveau QWEN3 d’Alibaba. Le groupe a noté que son enquête est en cours, l’analyse initiale des activations du modèle montrant également un chevauchement substantiel.

Le groupe a directement contesté la notion de coïncidence, arguant que le nombre de traits qui se chevauchent pointe vers une copie délibérée. They also claimed to have received statements from multiple whistleblower that supported their hypothesis:

“We received messages from multiple whistleblowers (claimed to be) in their team. They confirmed the accusation towards Pangu Pro MoE and also confirmed that there exists a version of Pangu Ultra MoE that is “very similar”to DeepSeek-V3 (still upcycling, but in other ways, which matches the information provided by issues 2 & 4). Le 7 juillet, son Noah Ark Lab a publié une déclaration affirmant que le modèle Pangu était «… non basé sur une formation incrémentielle des modèles d’autres fabricants…» et a été développé indépendamment à partir de zéro. Le laboratoire a insisté sur le fait que le modèle a été entièrement construit sur les puces ASCENS ASCENCES de Huawei.

Tout en reconnaissant l’utilisation de certains code open-source tiers, la déclaration de Huawei a souligné que son équipe de développement a strictement adhéré à toutes les exigences de licence. Le déni de déni Le modèle Pangu est un élément clé de sa stratégie d’auto-réparation, et non comme une œuvre dérivée.

Une «guerre» AI dans un écosystème sanctionné

Cet affrontement de propriété intellectuelle se déroule quelques jours seulement après que Huawei a fait un pivot stratégique majeur. Le 2 juillet, la société ouverte ses modèles Pangu, une décision largement interprétée comme un effort pour construire un écosystème logiciel captif autour de son matériel.

Cette stratégie vise à stimuler les ventes de ses accélérateurs d’IA Ascend, créant une pile technologique autosuffisante pour contrer la lutte contre les sanctions américaines. Comme l’a noté Mark Einstein de Counterpoint, «son objectif est finalement d’utiliser des produits open source pour stimuler les ventes de matériel, ce qui est un modèle complètement différent des autres». Cette approche axée sur le matériel est cruciale pour la survie et la compétitivité de Huawei.

L’incident souligne la concurrence féroce dans le secteur de l’IA chinois, souvent surnommé une «guerre de cent modèles». Les géants de la technologie comme Alibaba, Baidu et maintenant Huawei sont agressivement ouverts de leur IA de base pour capturer le développeur MindShare et la domination du marché.

Cette poussée de source ouverte est essentielle car les contrôles d’exportation américains ont effectivement coupé les entreprises chinoises de NVIDIA GPUS de haut niveau. L’aspirateur matériel qui en résulte a fait de Huawei’s Ascend Chips une alternative vitale pour les promoteurs domestiques.

Paul Triolo du groupe Albright Stonebridge a prédit que les limites américaines”… signifieront que le GPU Ascend 910C de Huawei deviendra désormais le matériel de choix pour les développeurs de modèles (chinois), la capacité de déploiement.”Qu’il soit prouvé ou non, complique les ambitions de Huawei. Il soulève des questions sur la transparence et la confiance à un moment où l’entreprise essaie de se positionner en tant que championne nationale en IA. Comme l’a dit Honestagi, à une époque où «continuer la formation n’est pas tout ce dont vous avez besoin pour voler un modèle», des méthodes robustes pour vérifier la provenance du modèle deviennent essentielles pour une concurrence équitable.

Categories: IT Info