Moonshot AI yang berpangkalan di Beijing mengeluarkan Kimi K2 pada hari Jumaat, sebuah siri model AI sumber terbuka yang bertujuan untuk menuntut semula kepimpinan pasaran dalam sektor AI yang kompetitif di China. Pelancaran ini adalah langkah strategik untuk mencabar pesaing seperti DeepSeek dan bersaing di seluruh dunia dengan firma A.S..
Kimi K2 adalah model campuran besar-besaran dengan 1 trilion parameter. Ia direka khusus untuk”kecerdasan agentik,”yang membolehkannya melaksanakan tugas-tugas kompleks secara autonomi dan menggunakan alat digital. Moonshot menekankan keupayaan Kimi K2 untuk bertindak, bukan hanya berbual, meletakkannya sebagai alat baru yang kuat untuk pemaju Ditubuhkan pada tahun 2023 oleh lulusan Universiti Tsinghua Yang Zhilin, Moonshot AI dengan cepat mendapat perhatian, tetapi kedudukan pasarannya baru-baru ini telah dicabar oleh langkah agresif dari pesaing tempatan. Pelancaran ini adalah tindak balas langsung dan kuat.
Perjudian strategik dalam peperangan AI yang sengit di China
Pangkalan pengguna Moonshot untuk aplikasi Kimi menyaksikan kedudukannya dari ketiga hingga ketujuh di China antara Ogos 2024 dan Jun 2025. Penurunan ini Pelepasan Kimi K2 adalah tawaran yang jelas untuk membalikkan trend ini.
Dengan sumber terbuka model perdana, Moonshot mengamalkan strategi yang semakin disukai oleh firma teknologi Cina. Pendekatan ini membantu membina komuniti pemaju yang luas dan memperluaskan pengaruh global, berkhidmat sebagai penangguhan yang kuat terhadap sekatan teknologi A.S.. Ia adalah judi untuk memenangi hati dan minda melalui kod.
Syarikat itu melepaskan model di bawah lesen MIT
Pelbagai tugas. Hasilnya menunjukkan prestasi yang kompetitif dalam beberapa bidang utama, termasuk pengekodan, penggunaan alat, dan penalaran kompleks.
Dalam penanda aras pengekodan, Kimi K2 mencapai skor 53.7 pada LiveCodeBench V6, berbanding dengan 47.4 untuk Claude Opus 4 dan 44.7 untuk GPT-4.1. Mengenai ujian pengekodan agentik SWE-Bench yang disahkan, ketepatannya adalah 65.8%, meletakkannya di atas DeepSeek-V3’s 38.8%dan GPT-4.1’s 54.6%, sementara trailing Claude Sonnet 4’s skor 72.7%. Untuk matematik dan penalaran, Kimi K2 juga menunjukkan hasil yang kuat. Pada penanda aras Pertandingan Matematik AIME 2024, skornya 69.6 lebih tinggi daripada Gemini 2.5 Flash (61.3) dan Claude Opus 4 (48.2). Begitu juga, pada ujian penalaran GPQA-Diamond, skor 75.1 sedikit melebihi Claude Opus 4’s 74.9. Pada penilaian pengetahuan umum seperti penanda aras MMLU, Kimi K2 menjaringkan 89.5. Ini meletakkannya dalam persaingan yang rapat dengan model sempadan lain, dengan GPT-4.1 menjaringkan 90.4 dan Claude Opus 4 mencapai 92.9. Secara kolektif, data mencadangkan Kimi K2 adalah model yang sangat berkebolehan, terutamanya dalam kategori sumber terbuka. href=”https://moonshotai.github.io/kimi-k2/”target=”_ blank”> 32 bilion diaktifkan untuk sebarang token yang diberikan . Senibina ini, sama seperti yang digunakan oleh saingan DeepSeek-V3, direka untuk kecekapan pengiraan pada skala besar, faktor utama untuk penggunaan praktikal. Senibina model menyokong panjang konteks 128k dan saiz perbendaharaan kata 160k. Ia mempunyai 384 pakar yang berbeza, dengan lapan dipilih untuk memproses setiap token, yang membolehkan pengiraan yang sangat khusus dan cekap. Reka bentuk ini adalah hasil analisis undang-undang skala yang bertujuan untuk memaksimumkan kecekapan token. Model ini terlatih pada data 15.5 trilion data. Untuk menguruskan proses ini tanpa kegagalan, Moonshot mengembangkan pengoptimuman novel”muonclip”. Teknik ini adalah evolusi kerja awal pada pengoptimal muon logit”yang boleh menggagalkan pembangunan model berskala besar. Syarikat melaporkan bahawa kaedah ini membolehkannya melengkapkan keseluruhan latihan token 15.5T yang dijalankan dengan”Latihan Zero Spike,”yang menonjolkan keteguhannya. Sistem ini menyerupai senario dunia sebenar dengan beribu-ribu alat, termasuk yang serasi dengan Protokol Konteks Model (MCP), untuk menghasilkan data latihan berasaskan rubrik yang berkualiti tinggi untuk penggunaan alat. Ini melibatkan mekanisme penghakiman sendiri di mana model bertindak sebagai pengkritiknya sendiri untuk memberi maklum balas mengenai tugas-tugas dengan ganjaran yang tidak dapat ditanggung, seperti menulis laporan, langkah penting dalam membangunkan kemahiran agensi yang lebih umum dan boleh dipercayai. Dua versi model . Kimi-K2-base adalah model asas, yang dimaksudkan untuk penyelidik yang memerlukan kawalan penuh untuk penalaan halus. Kimi-K2-Instruct adalah versi pasca terlatih yang dioptimumkan untuk berbual dan digambarkan sebagai”model gred refleks tanpa berfikir panjang”untuk tugas-tugas agensi yang luar biasa. href=”https://platform.moonshot.ai/”target=”_ blank”> pemaju api , dan adalah kecerdasan agentik berikutan industri asas beralih dari pembantu AI yang hanya mencadangkan teks atau kod. Ejen AI direka untuk memahami matlamat, membuat rancangan, dan menggunakan alat untuk melaksanakan tugas-tugas yang kompleks, pelbagai langkah. Nilai pendekatan agensi ini telah disahkan oleh syarikat. Dalam satu langkah mercu tanda, bank pelaburan Goldman Sachs baru mula mengetuai AI AI Coder Devin. Bank itu bertujuan untuk membina”tenaga kerja hibrid”di mana jurutera manusia mengawasi beribu-ribu ejen AI. Tenaga Kerja dengan Devin, yang akan menjadi seperti pekerja baru kami yang akan mula melakukan perkara bagi pihak pemaju kami,”mengalihkan tumpuan manusia dari pengekodan yang membosankan ke pengawasan peringkat tinggi. Trend ini tidak terhad untuk membiayai. Pasaran pengekodan AI yang lebih luas adalah medan perang, dengan Google melancarkan ejen Jules dan Gemini CLI percuma. Openai memberikan akses internet ejen Codex, walaupun CEO Sam Altman memberi amaran kepada pengguna untuk”membaca tentang risiko dengan teliti dan gunakan apabila masuk akal,”Mengakui risiko yang wujud. Sementara itu, pemula memberi tumpuan kepada integrasi aliran kerja yang mendalam. Anysphere, pembuat editor AI Cursor AI yang popular, baru-baru ini melancarkan aplikasi web untuk menguruskan ejen pengekodannya dari mana-mana peranti. Strategi”multi-permukaan”ini bertujuan untuk menjadikan AI sebagai kolaborator ambien yang sentiasa hadir.