北京に本拠を置くMoonshot AIは、中国の競争力のあるAIランドスケープで市場のリーダーシップを取り戻すことを目的としたオープンソースAIモデルシリーズである金曜日にKimi K2をリリースしました。この打ち上げは、Deepseekのようなライバルに挑戦し、米国企業と世界的に競争する戦略的な動きです。 「エージェントインテリジェンス」向けに特別に設計されており、複雑なタスクを自律的に実行してデジタルツールを使用できるようにします。ムーンショットは、チャットだけでなく、キミK2の行動能力を強調し、開発者向けの強力な新しいツール。 2023年にティンシュア大学の卒業生ヤン・ジリンによって設立されたムーンショットAIはすぐに著名になりましたが、その市場の地位は最近、地元の競合他社からの積極的な動きによって挑戦されています。この起動は直接的で力強い応答です。

中国の激しいAI戦争における戦略的ギャンビット

Kimiアプリケーションのユーザーベースでは、2024年8月から2025年6月の間に中国で3番目から7番目までのランキングスリップが見られました。 Kimi K2のリリースは、この傾向を逆転させるための明確な入札です。

フラッグシップモデルをオープンソーシングすることにより、Moonshotは中国の技術企業がますます支持する戦略を採用しています。このアプローチは、幅広い開発者コミュニティの構築に役立ち、世界的な影響力を拡大し、米国の技術制限に強力な対策として機能します。コードを通じて心と心を獲得するのはギャンビットです。

同社は、a 修正されたmitライセンス、実験を奨励しています。この動きは、キミを開発者のための頼りになるプラットフォームとして再確立することを目的としており、優れた能力とオープンエコシステムが市場シェアを獲得できることを賭けています。結果は、コーディング、ツールの使用、複雑な推論など、いくつかの重要な領域での競争力を示しています。

コーディングベンチマークでは、Kimi K2はLivecodebench V6で53.7のスコアを達成しました。 Agent Coding Test SWE-Bench Verifidedでは、その単一の触力の精度は65.8%であり、DeepSeek-V3の38.8%とGPT-4.1の54.6%を上回り、Claude Sonnet 4のスコアは72.7%でした。 Tau2テレコムタスクでは、Kimi K2は65.8を獲得しました。これは、GPT-4.1(38.6)およびClaude Sonnet 4(45.2)の報告スコアよりも高かった。これは、外部ツールとのインターフェースの目標を達成するための強い適性を示唆しています。

数学と推論については、Kimi K2も強力な結果を示しました。 AIME 2024 Math Competitionベンチマークでは、69.6のスコアはGemini 2.5 Flash(61.3)およびClaude Opus 4(48.2)のスコアよりも高かった。同様に、GPQA-ダイアモンド推論テストでは、MMLUベンチマークなどの一般的な知識評価で75.1のスコアがClaude Opus 4の74.9をわずかに超えました。これにより、他のフロンティアモデルと緊密な競争になり、GPT-4.1は90.4を獲得し、Claude Opus 4は92.9を達成しました。集合的に、データは、Kimi K2が特にオープンソースカテゴリで非常に有能なモデルであることを示唆しています。 href=”https://moonshotai.github.io/kimi-k2/”ターゲット=”_ blank”> 320億は、任意のトークンに対してアクティブ化されます。このアーキテクチャは、ライバルのDeepseek-V3が使用するものと同様に、実用的な展開の重要な要素である大規模な計算効率のために設計されています。

モデルのアーキテクチャは、128Kコンテキストの長さと160kの語彙サイズをサポートします。 384人の異なる専門家を備えており、8人が各トークンを処理するために選択され、高度に専門的で効率的な計算が可能になります。この設計は、トークンの効率を最大化することを目的としたスケーリング法の分析の結果です。

モデルは、15.5兆個のデータで事前に訓練されていました。このプロセスを失敗せずに管理するために、Moonshotは小説「Muonclip」オプティマイザーを開発しました。この手法は、その Muon Optimizer の以前の作業の進化です。ロジット「大規模なモデル開発が脱線する可能性があります。同社は、この方法により、「ゼロトレーニングスパイク」で15.5Tトークントレーニングを実行することができると報告しています。その堅牢性を強調しています。

コアアーキテクチャを超えて、Kimi K2のエージェント機能は洗練されたデータ合成パイプラインを通じて磨かれました。このシステムは、モデルコンテキストプロトコル(MCP)と互換性のあるものを含む数千のツールで実際のシナリオをシミュレートし、ツール使用のための高品質のルーブリックベースのトレーニングデータを生成します。これには、モデルがレポートを書くなど、より一般的で信頼できるエージェントスキルを開発するための重要なステップなど、タスクに関するフィードバックを提供する独自の批評家として機能する自己判断メカニズムが含まれます。ターゲット=”_ blank”>モデルの2つのバージョンのリリース。 Kimi-K2-Baseは基礎モデルであり、微調整のために完全な制御を必要とする研究者を対象としています。 Kimi-K2-Instructは、チャット用に最適化されたポストトレーニングを受けたバージョンであり、すぐに使用できるエージェントタスク向けの「長期にわたる思考のない反射グレードモデル」と説明されています。 href=”https://platform.moonshot.ai/”ターゲット=”_ blank”>開発者api 、および