HuaweiのAIラボは、Honestagiと呼ばれる研究グループからの盗作の告発に反対しています。グループは金曜日に、Huaweiの新しいPangu Pro AIモデルはAlibabaのQwen 2.5モデルのコピーであると主張しました。 7月7日土曜日の声明で、HuaweiのNoah Ark Labは料金を拒否しました。中国の活況を呈しているAI産業内での激しい競争と知的財産の戦い。米国の制裁の中で地元のハイテク大手が支配のために競争するように、彼らの基礎モデルの完全性は、グローバルなオープンソースコミュニティからの激しい精査の下にあります。 href=”https://web.archive.org/web/202507040101/https://github.com/honestagi/llm-fingerprint”target=”_ blank”> githubに関する削除されたレポート(Web Archive経由で入手可能)。この文書は、Huaweiの最近オープンソースのPangue Pro Moeモデルはオリジナルの作成ではなく、ライバルのAlibabaのQwen 2.5 14bモデルの「アップサイクル」バージョンであると主張しています。 src=”data:image/svg+xml; nitro-empty-id=mtyzodoxmte4-1; base64、phn2zyb2awv3qm94psiwidagotawidewmd aiihdpzhropsi5mdaiighlawdodd0imtawmcigeg1sbnm9imh0dha6ly93d3cudzmub3jnlziwmdavc3znij48l3n2zz4=”>
盗作の「指紋」?
正直な主張は、小説「フィンガープリント」技術に基づいています。このメソッドは、モデルのレイヤー全体で、注意パラメーターマトリックス(q、k、v、o)の標準偏差パターン(q、k、v、o)を分析します。研究者は、これらのパターンはモデルのアーキテクチャとトレーニング履歴の本質的な特性であると主張しています。
この分析は、PanguとQwenの間の0.927の「並外れた相関」と呼ばれるものを明らかにしました。 Honestagiは、この統計的指紋は、盗まれたモデルから従来の透かしを消去できる一般的な手法である継続的なトレーニングに耐えるのに十分な堅牢性であると主張します。彼らは、QKVバイアスの投影と注意のレイヤーモルトの重みでほぼ同一のパターンを強調しました。研究者は、 gitcode のpangueの公式コードリポジトリ内でqwenライセンスファイルを発見しました。 Honestagiは、「これらのポイントはすべて一致しているのでしょうか?おそらくそうではない」と述べて論文を締めくくりました。
研究者によると、これらのユニークなパターンはモデルの基本アーキテクチャから自然に現れ、基本的な関数、torch.std()、パラメーターマトリックスに適用されることで計算できます。これらの標準偏差値をすべての層にわたって正規化することにより、継続的なトレーニングのような大幅な変更の後でもモデルの系統を識別できる特徴的な署名を作成します。彼らは、PanguのQKVバイアスパターンがQWEN 2.5のほぼ完璧な一致であることを強調しました。 QKVバイアスは、Alibaba自身の新しいQWEN3を含むほとんどのオープンソースプロジェクトによって放棄された初期のQWENモデルの特徴であるため、彼らはこれを特に「ダム」と呼んだと主張します。グループは、彼らの調査が進行中であり、モデルの活性化の初期分析もかなりの重複を示していることを指摘しました。
グループは、偶然の概念に直接挑戦し、膨大な数の重複する特性が意図的なコピーを指していると主張しました。彼らはまた、彼らの仮説を支持する複数の内部告発者から声明を受け取ったと主張しました:
「私たちは彼らのチームで複数の内部告発者(主張された)からメッセージを受け取りました。問題2&4)にもかかわらず、これらのメッセージは、Pange Ultra Moeがリリースされず、これらの内部告発者のアイデンティティを確認することができないため、検証できません。 7月7日、Noah Ark Labは、Panguモデルが「…他のメーカーのモデルの増分トレーニングに基づいていない…」と主張する声明を発表し、独立してゼロから開発されました。ラボは、モデルがHuawei独自のAi Chipsに完全に構築されていることを強調しました。
サードパーティのオープンソースコードの使用を認めながら、Huaweiの声明は、開発チームがすべてのライセンス要件を厳密に遵守していることを強調しました。拒否は、派生的な作業ではなく、自立戦略の重要な部分としてPanguモデルをフレーム化します。 7月2日、同社はPanguモデルをオープンソーリングしました。これは、ハードウェアの周りに捕虜ソフトウェアエコシステムを構築する努力として広く解釈されています。カウンターポイントのマーク・アインシュタインが指摘したように、「その目的は、最終的にオープンソース製品を使用して、他のモデルとはまったく異なるモデルであるハードウェアの販売を促進することです。」このハードウェアファーストアプローチは、Huaweiの生存と競争力にとって非常に重要です。
この事件は、しばしば「100モデルの戦争」と呼ばれる中国のAIセクターでの激しい競争を強調しています。 Alibaba、Baidu、および現在Huaweiのようなハイテク大手は、開発者のマインドシェアと市場の支配を獲得するために、コアAIを積極的にオープンソーシングしています。結果として得られるハードウェアの真空により、Huaweiのアセンドチップは国内開発者にとって重要な代替手段になりました。
Albright Stonebridge GroupのPaul Trioloは、米国の縁石を「…HuaweiのAscend 910C GPUが選択のハードウェアになることを意味します。証明されているかどうかにかかわらず、Huaweiの野望を複雑にします。会社がAIの全国チャンピオンとしての地位を確立しようとしている瞬間に、透明性と信頼に関する疑問を提起します。 Honestagiが言ったように、「継続的なトレーニングがモデルを盗むために必要なすべてではない」時代に、モデルの起源を検証するための堅牢な方法は、公正な競争に不可欠になりつつあります。