pekingi alapú Moonshot AI pénteken adta ki a Kimi K2-t, egy nyílt forráskódú AI modell sorozatot, amelynek célja a piaci vezetés visszanyerése a kínai versenyképes AI-szektorban. Az indítás stratégiai lépés a riválisok, mint például a DeepSeek és a Globálisan versenyezve az amerikai cégekkel. Kifejezetten az „agentikus intelligencia”-ra tervezték, amely lehetővé teszi, hogy a bonyolult feladatok önállóan végrehajthassa és digitális eszközöket használjon. A Moonshot hangsúlyozza Kimi K2 cselekvési képességét, nem csak a csevegést, és úgy pozicionálja, hogy a új eszközök erőteljes eszköze. A Tsinghua Egyetem diplomáját, Yang Zhilin által 2023-ban alapított Moonshot AI gyorsan kiemelkedő szerepet kapott, ám piaci helyzetét a közelmúltban a helyi versenytársak agresszív lépései vitatják. Ez az indítás közvetlen és erőteljes válasz. src=”adatok: image/svg+xml; nitro-üres-id=mty0ntoxmti3-1; base64, phn2zyb2awv3qm94psiwidagmti4mca3mJ Aiihdpzhropsixmjgwiibozwlnahq9ijcymcygeg1sbnm9imh0dha6ly93d3cudzmub3jnlziwmdavc3znij48l3n2z4=”>”>”>”>”>”>”>”>”>”>”>”>”>”>”>

stratégiai gambit Kína heves AI-háborújában

Moonshot felhasználói bázisának kimi alkalmazásához 2024 augusztus és a 2025. június között a harmadik és hetedik helyen áll Kínában. A Kimi K2 kiadás egyértelmű ajánlat ennek a tendenciának a megfordítására. Ez a megközelítés elősegíti a széles körű fejlesztői közösség felépítését és a globális befolyást kibővíti, amely erőteljes ellenintézkedésként szolgál az Egyesült Államok technológiai korlátozásainak. Ez egy gambit a szív és az elme megnyerése a kódon keresztül. Ennek a lépésnek a célja, hogy helyreállítsa Kimi-t, mint a fejlesztők go-to-platformját, és azt fogadja el, hogy a kiváló képesség és a nyílt ökoszisztéma visszaszerezheti a piaci részesedést. Feladatok. Az eredmények számos kulcsfontosságú területen a versenyképességet jelzik, beleértve a kódolást, a szerszámhasználatot és az összetett érvelést. Az Agentic Coding Test Swe-Pench által ellenőrzött tesztnél az egyszemélyes pontos pontossága 65,8%volt, és a DeepSeek-V3 38,8%-os és a GPT-44.1 54,6%-a fölé helyezte, míg a Claude Sonnet 4 pontszámát 72,7%-os pontszáma. A TAU2 telekommunikációs feladat során a Kimi K2 65,8-at szerzett, ami magasabb volt, mint a GPT-4.1 (38,6) és a Claude Sonnet 4 (45,2) pontszáma. Ez azt sugallja, hogy erős képessége van a külső eszközökkel való kapcsolattartáshoz a célok eléréséhez. Az AIME 2024 matematikai verseny referenciaértékén a 69,6-os pontszáma magasabb volt, mint a Gemini 2.5 Flash (61,3) és a Claude Opus 4 (48,2) pontszáma. Hasonlóképpen, a GPQA-Diamond érvelési tesztnél a 75,1-es pontszám kissé meghaladta a Claude Opus 4 74,9-et. Ez szoros versenybe helyezi a többi határ modellt, a GPT-4.1-et a 90.4-es pontszámmal és a Claude Opus 4-et 92,9-re. Az adatok együttesen azt sugallják, hogy a kimi k2 nagyon képes modell, különösen a nyílt forráskódú kategóriában. href=”https://moonshotai.github.io/kimi-k2/”Target=”_ blank”> 32 milliárd aktiválva van bármelyik tokenhez . Ezt az architektúrát, hasonlóan a rivális DeepSeek-V3-hoz, a számítási hatékonyságra tervezték hatalmas skálán, amely a gyakorlati telepítés kulcsfontosságú tényezője. 384 különálló szakértővel rendelkezik, és nyolcat választottak ki az egyes tokenek feldolgozására, lehetővé téve a rendkívül specializált és hatékony számítást. Ez a kialakítás a token hatékonyságának maximalizálására irányuló méretezési jogi elemzés eredménye. Ennek a folyamatnak a kudarc nélkül történő kezelése érdekében a Moonshot új „Muonclip” optimalizátort fejlesztett ki. Ez a technika a korábbi munkája a muon optimalizálóval végzett munkájának fejlődése, amely felülmúlja a standard ADAMW optimalizót, de az instabilitástól függő mértékben szenvedhet. Logits”, amely kiskereskedelmi modellfejlesztést okozhat. A vállalat jelentése szerint ez a módszer lehetővé tette a teljes 15,5T token edzési futtatást a „Zero Training Spike”-nel, kiemelve annak robusztusságát. Ez a rendszer szimulálja a valós forgatókönyveket több ezer eszközzel, ideértve a modellkontextus-protokoll (MCP)-vel kompatibilis célokat is, hogy kiváló minőségű, rubrikus alapú képzési adatokat generáljon a szerszámhasználathoz. Ez magában foglalja az önértékelő mechanizmust, amelyben a modell saját kritikusként működik, hogy visszajelzést adjon a feladatokról, nem ellenőrizhető jutalmakkal, például egy jelentés megírása, a legfontosabb lépés az általánosabb és megbízható ügynökök fejlesztésében. A modell verziói . A KIMI-K2-Base az alapvető modell, amelyet olyan kutatóknak szántak, akiknek teljes ellenőrzésre van szükségük a finomhangoláshoz. A KIMI-K2-Instrukció egy poszt-kiképzett verzió, amelyet a csevegéshez optimalizáltak, és „reflex minőségű modellnek tekintik, hosszú gondolkodás nélkül” a dobozon kívüli ügynöki feladatokhoz. href=”https://platform.moonshot.ai/”Target=”_ blank”> Developer API , és Undictions to Snifiling . A vállalat átláthatóan megjegyzi, hogy a modellnek korlátozásai vannak, beleértve az alkalmi teljesítménycseppeket, amikor az eszközhasználat engedélyezve van, a Kiadja a . Az alapvető iparágot követő ügynöki intelligencia elmozdul az AI asszisztensektől, amelyek pusztán szöveget vagy kódot javasolnak. Az AI ügynökök célja egy cél megértése, egy terv létrehozása és eszközök felhasználása a komplex, többlépcsős feladatok végrehajtásához. Egy mérföldkőnek megfelelő lépésben a Goldman Sachs befektetési bank éppen elkezdte az autonóm AI kódoló Devin pilótatását. A bank célja egy „hibrid munkaerő” felépítése, ahol humán mérnökei több ezer AI ügynököt felügyelnek. Devinnel végzett munkaerőnk, amely olyan lesz, mint az új alkalmazottunk, aki fejlesztőink nevében elkezdi cuccokat csinálni,”az emberi fókuszt az unalmas kódolástól a magas szintű felügyeletre változtatva.

Ez a tendencia nem korlátozódik a pénzügyekre. A szélesebb AI kódolási piac egy csatatér, a Google pedig elindította a Jules ügynökét és az INGYENES Ikrek CLI-t. Az Openai megadta a Codex Agent Internet Access-t, bár Sam Altman vezérigazgató figyelmeztette a felhasználókat, hogy „gondosan olvassák el a kockázatokat és használják, amikor van értelme”, elismerve a velejáró kockázatokat. Az AnySphere, a népszerű AI szerkesztő készítője nemrégiben elindított egy webalkalmazást, hogy bármely eszközről kezelje kódoló ügynökeit. Ez a „multi-surface” stratégia célja, hogy az AI-t környezeti, állandóan jelenlévő munkatársá tegye.

Categories: IT Info