Ang AI Lab ng Huawei ay nagtutulak laban sa mga akusasyon ng plagiarism mula sa isang pangkat ng pananaliksik na tinatawag na Honestagi. Inangkin ng grupo noong Biyernes na ang bagong modelo ng Pangu Pro AI ng Huawei ay isang kopya ng modelo ng QWEN 2.5 ng Alibaba. Sa isang pahayag noong Sabado, Hulyo 7, tinanggihan ni Noah Ark Lab ng Huawei ang singil, Ang pagtatalo ng modelo nito ay binuo nang nakapag-iisa . Malubhang kumpetisyon at mga laban sa intelektwal na pag-aari sa loob ng industriya ng AI ng Tsina. Tulad ng lahi ng Lokal na Tech Giants para sa pangingibabaw sa gitna ng mga parusa sa Estados Unidos, ang integridad ng kanilang mga modelo ng pundasyon ay darating sa ilalim ng matinding pagsisiyasat mula sa pandaigdigang pamayanan ng open-source. href=”https://web.archive.org/web/20250704010101/https://github.com/honestagi/llm-fingerprint”target=”_ blangko”> Nai-publish na isang natanggal na ulat sa github (magagamit sa pamamagitan ng web archive) . Sinabi ng dokumento na ang kamakailan-lamang na open-sourced na modelo ng Pangu Pro Moe ay hindi isang orihinal na paglikha ngunit isang”upcycled”na bersyon ng karibal na Alibaba’s QWEN 2.5 14B na modelo. src=”data: imahe/svg+xml; nitro-empty-id=mtyzodoxmte4-1; base64, phn2zyB2AWV3QM94PSIWIDAGOWIDEWMD Aiihdpzhropsi5mdaiighlawdodd0imtawmcigeg1sbnm9imh0dha6ly93d3cudzmub3jnlziWmdavc3znij48l3n2zz4=”>

isang”fingerprint”ng plagiarism? Sinusuri ng pamamaraan ang karaniwang mga pattern ng paglihis ng mga matrice ng parameter ng pansin (Q, K, V, O) sa mga layer ng isang modelo. Nagtatalo ang mga mananaliksik na ang mga pattern na ito ay isang intrinsikong pag-aari ng arkitektura at kasaysayan ng pagsasanay ng isang modelo. Ang Honestagi ay nakikipagtalo sa statistical fingerprint na ito ay sapat na matatag upang mabuhay ang patuloy na pagsasanay, isang karaniwang pamamaraan na maaaring burahin ang mga tradisyonal na watermark mula sa isang ninakaw na modelo. Itinampok nila ang halos magkaparehong mga pattern sa QKV bias projections at mga bigat ng atensyon ng mga timbang. Natuklasan pa ng mga mananaliksik ang isang file ng lisensya ng QWEN sa loob ng Opisyal na Code Repository ng Pangu sa Gitcode . Tinapos ng Honestagi ang papel nito sa pamamagitan ng pagsasabi,”Ang lahat ng mga puntong ito ay mga coincidences? Marahil hindi.”Sa pamamagitan ng pag-normalize ng mga pamantayang halaga ng paglihis sa lahat ng mga layer, lumikha sila ng isang natatanging pirma na may kakayahang makilala ang linya ng isang modelo kahit na matapos ang mga makabuluhang pagbabago tulad ng patuloy na pagsasanay. Itinampok nila na ang mga pattern ng bias ng QKV sa Pangu ay isang malapit na perpektong tugma para sa QWEN 2.5. Tinawag nila ito lalo na”pinapahamak”, pinagtutuunan nila, dahil ang QKV bias ay isang natatanging tampok ng mga unang modelo ng QWEN na mula nang inabandona ng karamihan sa mga open-source na proyekto, kasama na ang sariling mas bagong QWEN3 ni Alibaba. Ang pangkat ay nabanggit na ang kanilang pagsisiyasat ay patuloy, na may paunang pagsusuri ng mga pag-activate ng modelo na nagpapakita din ng malaking overlap. Inangkin din nila na nakatanggap ng mga pahayag mula sa maraming whistleblower na sumusuporta sa kanilang hypothesis: 2 & 4). Noong Hulyo 7, ang Noah Ark Lab ay naglabas ng isang pahayag na iginiit ang modelo ng Pangu ay”… hindi batay sa pagdaragdag ng pagsasanay ng iba pang mga modelo ng tagagawa…”at nakapag-iisa na binuo mula sa ground up. Binigyang diin ng lab na ang modelo ay buo na itinayo sa pagmamay-ari ng Huawei na Ascend AI chips. Ang pagtanggi ay nag-frame ng modelo ng Pangu bilang isang pangunahing bahagi ng diskarte sa pagsandig sa sarili, hindi isang derivative na gawain. Noong Hulyo 2, ang kumpanya na bukas-sourced ang mga modelo ng Pangu, isang paglipat na malawak na binibigyang kahulugan bilang isang pagsisikap na bumuo ng isang bihag na ecosystem ng software sa paligid ng hardware nito. Tulad ng nabanggit ni Mark Einstein ng Counterpoint,”ang layunin nito ay sa huli ay gumamit ng mga bukas na mapagkukunan ng mga produkto upang magmaneho ng mga benta ng hardware, na isang ganap na naiibang modelo mula sa iba.”Ang diskarte na ito na unang hardware ay mahalaga para sa kaligtasan at pagiging mapagkumpitensya ng Huawei. Ang mga higanteng Tech tulad ng Alibaba, Baidu, at ngayon ang Huawei ay agresibo na bukas-sourcing ang kanilang pangunahing AI upang makuha ang developer ng isip at pangingibabaw sa merkado. Ang nagresultang vacuum ng hardware ay nagawa ang pag-akyat ng Huawei ng isang mahalagang alternatibo para sa mga domestic developer. Ang akusasyon, napatunayan man o hindi, kumplikado ang mga ambisyon ng Huawei. Nagtaas ito ng mga katanungan tungkol sa transparency at tiwala sa isang sandali kapag sinusubukan ng kumpanya na iposisyon ang sarili bilang isang pambansang kampeon sa AI. Tulad ng inilalagay ito ng Honestagi, sa isang panahon kung saan ang”magpatuloy na pagsasanay ay hindi lahat kailangan mong magnakaw ng isang modelo”, ang matatag na pamamaraan para sa pagpapatunay ng pagpapatunay ng modelo ay nagiging mahalaga para sa patas na kumpetisyon.

Categories: IT Info