A

huawei AI laboratóriuma visszatért a Plagiarizmus vádjai ellen egy Semrestagi nevű kutatócsoportból. A csoport pénteken azt állította, hogy a Huawei új Pangu Pro AI modellje az Alibaba QWEN 2.5 modellének másolata. A július 7-én, szombaton tartott nyilatkozatában a Huawei Noah Ark Labja tagadta a töltést, A jelölést függetlenül fejlesztették ki . Intenzív verseny-és szellemi tulajdonban lévő csaták Kína virágzó AI-iparában. Ahogy a helyi technológiai óriások az amerikai szankciók közepette versenyeznek az uralkodásért, alapvető modelljeik integritása a globális nyílt forráskódú közösség intenzív ellenőrzése alatt áll. href=”https://web.archive.org/web/20250704010101/https://github.com/honestagi/llm-fingerprint”Target=”_ blank”> közzétett egy most eltávolított jelentést a GitHub-ról (elérhető web archive-n keresztül) . A dokumentum azt állítja, hogy a Huawei nemrégiben nyílt forrású Pangu Pro Moe modellje nem eredeti alkotás, hanem a rivális Alibaba QWen 2,5 14B modelljének „újrahasznosított” verziója. src=”adatok: image/svg+xml; nitro-üres-id=mtyzodoxmte4-1; base64, phn2zyb2awv3qm94psiwidagotawidewmd AiiHdpzhropsi5mdaiighLawdodd0ImTawMCigeg1Sbnm9IMH0DHA6LY93D3CUDZMUB3JNLZIWMDAVC3ZNIJ48L3N2Zz4=”>”>”>”>”>”>”>”>”>”>”>”>”>”>”>”>”>”>”>

A plágium „ujjlenyomata”? A módszer elemzi a figyelem-paraméter-mátrixok (Q, K, V, O) standard eltérési mintáit a modell rétegeiben. A kutatók szerint ezek a minták a modell építészetének és képzési előzményeinek belső tulajdonságai. A Honorsagi azt állítja, hogy ez a statisztikai ujjlenyomat elég robusztus ahhoz, hogy túlélje a folytatódó edzést, ez egy általános technika, amely a hagyományos vízjeleket törölheti egy ellopott modellből. Kiemelték a QKV torzítás előrejelzéseinek és a laikusok súlyának szinte azonos mintáit. A kutatók még a QWEN licencfájlt is felfedeztek a Pangu hivatalos kódrapository a GitCode-on . A Honestagi a tanulmányát azzal zárta, hogy kijelenti: „Mindezek a pontok egybeesések? Valószínűleg nem.”

A kutatók szerint ezek az egyedi minták természetesen a modell alapvető architektúrájából származnak, és a paraméter-matricákra alkalmazott alapfunkcióval, a fáklya.std ()-val kiszámíthatók. Ha ezeket a szórási értékeket az összes rétegben normalizálja, olyan jellegzetes aláírást hoznak létre, amely képes azonosítani a modell vonalát még olyan jelentős módosítások után, mint a folyamatos képzés. Kiemelték, hogy a Panguban a QKV elfogultsági mintái közel tökéletes mérkőzések voltak a QWEN 2.5 számára. Azt állítják, hogy ezt különösen „rohadtnak” nevezték, mert a QKV torzulása a korai QWEN modellek megkülönböztető tulajdonsága volt, amelyet azóta a legtöbb nyílt forráskódú projekt elhagyott, ideértve az Alibaba saját újabb QWEN3-ját. A csoport megjegyezte, hogy vizsgálata folyamatban van, a modell aktiválásainak kezdeti elemzése szintén jelentős átfedést mutat. They also claimed to have received statements from multiple whistleblower that supported their hypothesis:

“We received messages from multiple whistleblowers (claimed to be) in their team. They confirmed the accusation towards Pangu Pro MoE and also confirmed that there exists a version of Pangu Ultra MoE that is “very similar”to DeepSeek-V3 (still upcycling, but in other ways, which matches the information provided by issues 2 és 4) Mindazonáltal ezek az üzenetek nem igazolhatók, mivel a Pangu Ultra Moe nem szabadul fel, és nem tudjuk megerősíteni ezeknek a bejelentőknek a személyazonosságát. Július 7-én a Noah Ark Lab nyilatkozatot tett közzé, amely szerint a Pangu-modell „… nem más gyártók modelljeinek növekményes képzésén alapult…”, és az alapoktól függetlenül fejlesztették ki. A laboratórium hangsúlyozta, hogy a modell teljes egészében a Huawei szabadalmaztatott Ascend Ai chipsre épült. A tagadás a Pangu modellt az önbizalom-stratégiájának kulcsfontosságú részeként, nem pedig származékos munkát képezi. Július 2-án a vállalat nyílt forráskódú volt a Pangu modelljeivel, egy széles körben úgy értelmezve, hogy egy fogságban tartott szoftver ökoszisztéma felépítésére irányuló erőfeszítésként szolgál a hardver körül. Ahogyan Mark Einstein, a Counterpoint megjegyezte,”célja az, hogy végül nyílt forráskódú termékeket használjon a hardverek értékesítésének elősegítésére, amely teljesen más modell, mint mások.”Ez a hardver első megközelítése elengedhetetlen a Huawei túlélése és versenyképessége szempontjából. Az olyan technikai óriások, mint az Alibaba, a Baidu, és most a Huawei agresszív módon nyitott forrásból készülnek, hogy megragadják a fejlesztő gondolatát és a piaci dominanciát. A kapott hardver vákuum a Huawei Ascend Chips-t alapvető alternatívává tette a háztartási fejlesztők számára. Bizonyított vagy sem, bonyolítja Huawei ambícióit. Kérdéseket vet fel az átláthatósággal és a bizalommal kapcsolatban abban a pillanatban, amikor a vállalat megpróbál nemzeti bajnokként pozicionálni magát az AI-ben. Ahogyan az őszinteagi fogalmazta, egy olyan korszakban, amikor „folytatja a képzést, nem minden, amire szükség van egy modell ellopásához”, a modell-származási hely ellenőrzésére szolgáló robusztus módszerek nélkülözhetetlenek a tisztességes versenyhez.

Categories: IT Info