Het AI-lab van Huawei duwt terug tegen beschuldigingen van plagiaat van een onderzoeksgroep genaamd Eerderagi. De groep beweerde vrijdag dat het nieuwe Pangu Pro Ai-model van Huawei een kopie is van het QWEN 2.5-model van Alibaba. In een verklaring op zaterdag 7 juli ontkende Huawei’s Noah Ark Lab de aanklacht, Stel zijn model is ontwikkeld . De intense concurrentie en intellectuele eigendom gevechten binnen de bloeiende AI-industrie van China. Terwijl de lokale technische reuzen racen voor dominantie te midden van Amerikaanse sancties, wordt de integriteit van hun fundamentele modellen onder intensieve controle van de wereldwijde open-source gemeenschap.

De controverse brak uit op 6 juli toen een groep die zichzelf noemt, eerlijke href=”https://web.archive.org/web/20250704010101/https://github.com/honestagi/llm-fingerprint”target=”_ blank”> gepubliceerd een nu verwijderd rapport over github (beschikbaar via webarchief) . Het document beweert dat het recent geopende Pangu Pro Moe-model van Huawei geen originele creatie is, maar een”upcycled”-versie van het QWEN 2.5 14B-model van rivaal Alibaba.

Een”vingerafdruk”van plagiaat?

De centrale claim van Fronagi berust op een nieuwe”vingerafdruk”-techniek. De methode analyseert de standaardafwijkingspatronen van aandachtsparametermatrices (Q, K, V, O) over de lagen van een model. De onderzoekers beweren dat deze patronen een intrinsieke eigenschap zijn van de architectuur-en trainingsgeschiedenis van een model.

Deze analyse onthulde wat de paper een”buitengewone correlatie”van 0,927 tussen Pangu en Qwen noemt. Fronagi beweert dat deze statistische vingerafdruk robuust genoeg is om voortdurende training te overleven, een gemeenschappelijke techniek die traditionele watermerken uit een gestolen model kan wissen.

Correlatieanalysekaarten van eerlijke gelijkenis

om de zaak te versterken, wees de groep op extra architecturale gelijkenissen. Ze benadrukten bijna identieke patronen in QKV BIAS-projecties en aandachtsladernormgewichten. De onderzoekers ontdekten zelfs een Qwen-licentiebestand in Pangu’s officiële code repository op gitcode . Fronagi concludeerde zijn artikel door te zeggen:”Al deze punten zijn toevalligheden? Waarschijnlijk niet.”

Volgens de onderzoekers komen deze unieke patronen op natuurlijke wijze voort uit de fundamentele architectuur van een model en kunnen worden berekend met een basisfunctie, Torch.std (), toegepast op de parametermatrices. Door deze standaardafwijkingswaarden over alle lagen te normaliseren, creëren ze een onderscheidende handtekening die in staat is om de lijn van een model te identificeren, zelfs na belangrijke wijzigingen zoals voortdurende training.

Om hun primaire claim te versterken, wezen de onderzoekers op een cascade van bevestigend bewijs. Ze benadrukten dat de QKV bias-patronen in Pangu een bijna perfecte match waren voor QWEN 2.5. Ze noemden dit bijzonder’verdomd’, beweren ze, omdat QKV Bias een onderscheidend kenmerk was van vroege Qwen-modellen die sindsdien is verlaten door de meeste open-source projecten, waaronder Alibaba’s eigen nieuwere Qwen3. De groep merkte op dat hun onderzoek aan de gang is, met initiële analyse van modelactiveringen die ook een substantiële overlapping vertoonden.

De groep betwistte direct het idee van toeval, met het argument dat het grote aantal overlappende eigenschappen wijst op een opzettelijke kopie. Ze beweerden ook dat ze uitspraken van meerdere klokkenluiders hebben ontvangen die hun hypothese ondersteunden:

“We hebben berichten ontvangen van meerdere klokkenluiders (beweerd te zijn) in hun team. Ze bevestigden de beschuldiging tegenover Pangu Pro Moe en bevestigden ook dat er een versie van Pangu Ultra Moe is die’zeer vergelijkbaar is’met een andere manier, maar in andere manieren. 2 & 4). Desalniettemin zijn deze berichten niet verifieerbaar omdat Pangu Ultra Moe niet is vrijgegeven en we de identiteiten van deze klokkenluiders niet kunnen bevestigen.”Op 7 juli gaf het Noah Ark Lab een verklaring die beweerde dat het Pangu-model was:”… niet gebaseerd op incrementele training van de modellen van andere fabrikanten…”en werd onafhankelijk van de grond ontwikkeld. Het lab benadrukte dat het model volledig werd gebouwd op de eigen AI-chips van Huawei. De ontkenning omlijst het Pangu-model als een belangrijk onderdeel van zijn zelfredzaamheidsstrategie, geen afgeleide werk.

een AI ‘oorlog’ in een gesanctioneerd ecosysteem

Dit intellectuele eigendom botst slechts enkele dagen nadat Huawei een grote strategische pivot had gemaakt. Op 2 juli heeft het bedrijf zijn Pangu-modellen geopend, een beweging die veel wordt geïnterpreteerd als een poging om een ​​captive software-ecosysteem rond zijn hardware op te bouwen.

Deze strategie heeft als doel de verkoop van ASID AI-versnellers te stimuleren, waardoor een zelfvoorzienende technologie-stapel wordt gecreëerd om de Amerikaanse sancties tegen te gaan. Zoals Mark Einstein van Counterpoint opmerkte,”het doel is om uiteindelijk open source-producten te gebruiken om de verkoop van hardwares te stimuleren, wat een heel ander model is dan anderen.”Deze hardware-eerste aanpak is cruciaal voor het overleven en concurrentievermogen van Huawei.

Het incident onderstreept de felle concurrentie in de AI-sector van China, vaak een”oorlog van honderd modellen”genoemd. Tech-reuzen zoals Alibaba, Baidu en nu zijn Huawei agressief open voor hun kern AI om ontwikkelaar Mindshare en marktdominantie te vangen.

Deze open-source duw is van cruciaal belang omdat Amerikaanse exportcontroles effectief de Chinese bedrijven van top-tier Nvidia GPU’s hebben afgesneden. The resulting hardware vacuum has made Huawei’s Ascend chips a vital alternative for domestic developers.

Paul Triolo of Albright Stonebridge Group predicted that U.S. curbs “…will mean that Huawei’s Ascend 910C GPU will now become the hardware of choice for (Chinese) AI model developers and for deploying inference capacity.”

The plagiarism accusation, whether Bewezen of niet, bemoeilijkt de ambities van Huawei. Het roept vragen op over transparantie en vertrouwen op een moment dat het bedrijf probeert zich te positioneren als een nationaal kampioen in AI. Zoals Fronagi het verwoordde, in een tijdperk waarin”doorgaan met training niet alles wat je nodig hebt om een ​​model te stelen”, worden robuuste methoden voor het verifiëren van modelaanbrenging essentieel voor eerlijke concurrentie.

Categories: IT Info