A plágium „ujjlenyomata”? A módszer elemzi a figyelem-paraméter-mátrixok (Q, K, V, O) standard eltérési mintáit a modell rétegeiben. A kutatók szerint ezek a minták a modell építészetének és képzési előzményeinek belső tulajdonságai. A Honorsagi azt állítja, hogy ez a statisztikai ujjlenyomat elég robusztus ahhoz, hogy túlélje a folytatódó edzést, ez egy általános technika, amely a hagyományos vízjeleket törölheti egy ellopott modellből. Kiemelték a QKV torzítás előrejelzéseinek és a laikusok súlyának szinte azonos mintáit. A kutatók még a QWEN licencfájlt is felfedeztek a Pangu hivatalos kódrapository a GitCode-on . A Honestagi a tanulmányát azzal zárta, hogy kijelenti: „Mindezek a pontok egybeesések? Valószínűleg nem.”
A kutatók szerint ezek az egyedi minták természetesen a modell alapvető architektúrájából származnak, és a paraméter-matricákra alkalmazott alapfunkcióval, a fáklya.std ()-val kiszámíthatók. Ha ezeket a szórási értékeket az összes rétegben normalizálja, olyan jellegzetes aláírást hoznak létre, amely képes azonosítani a modell vonalát még olyan jelentős módosítások után, mint a folyamatos képzés. Kiemelték, hogy a Panguban a QKV elfogultsági mintái közel tökéletes mérkőzések voltak a QWEN 2.5 számára. Azt állítják, hogy ezt különösen „rohadtnak” nevezték, mert a QKV torzulása a korai QWEN modellek megkülönböztető tulajdonsága volt, amelyet azóta a legtöbb nyílt forráskódú projekt elhagyott, ideértve az Alibaba saját újabb QWEN3-ját. A csoport megjegyezte, hogy vizsgálata folyamatban van, a modell aktiválásainak kezdeti elemzése szintén jelentős átfedést mutat. They also claimed to have received statements from multiple whistleblower that supported their hypothesis:
“We received messages from multiple whistleblowers (claimed to be) in their team. They confirmed the accusation towards Pangu Pro MoE and also confirmed that there exists a version of Pangu Ultra MoE that is “very similar”to DeepSeek-V3 (still upcycling, but in other ways, which matches the information provided by issues 2 és 4) Mindazonáltal ezek az üzenetek nem igazolhatók, mivel a Pangu Ultra Moe nem szabadul fel, és nem tudjuk megerősíteni ezeknek a bejelentőknek a személyazonosságát. Július 7-én a Noah Ark Lab nyilatkozatot tett közzé, amely szerint a Pangu-modell „… nem más gyártók modelljeinek növekményes képzésén alapult…”, és az alapoktól függetlenül fejlesztették ki. A laboratórium hangsúlyozta, hogy a modell teljes egészében a Huawei szabadalmaztatott Ascend Ai chipsre épült. A tagadás a Pangu modellt az önbizalom-stratégiájának kulcsfontosságú részeként, nem pedig származékos munkát képezi. Július 2-án a vállalat nyílt forráskódú volt a Pangu modelljeivel, egy széles körben úgy értelmezve, hogy egy fogságban tartott szoftver ökoszisztéma felépítésére irányuló erőfeszítésként szolgál a hardver körül. Ahogyan Mark Einstein, a Counterpoint megjegyezte,”célja az, hogy végül nyílt forráskódú termékeket használjon a hardverek értékesítésének elősegítésére, amely teljesen más modell, mint mások.”Ez a hardver első megközelítése elengedhetetlen a Huawei túlélése és versenyképessége szempontjából. Az olyan technikai óriások, mint az Alibaba, a Baidu, és most a Huawei agresszív módon nyitott forrásból készülnek, hogy megragadják a fejlesztő gondolatát és a piaci dominanciát. A kapott hardver vákuum a Huawei Ascend Chips-t alapvető alternatívává tette a háztartási fejlesztők számára. Bizonyított vagy sem, bonyolítja Huawei ambícióit. Kérdéseket vet fel az átláthatósággal és a bizalommal kapcsolatban abban a pillanatban, amikor a vállalat megpróbál nemzeti bajnokként pozicionálni magát az AI-ben. Ahogyan az őszinteagi fogalmazta, egy olyan korszakban, amikor „folytatja a képzést, nem minden, amire szükség van egy modell ellopásához”, a modell-származási hely ellenőrzésére szolgáló robusztus módszerek nélkülözhetetlenek a tisztességes versenyhez.