Księżycowa sztuczna inteligencja z siedzibą w Pekinie wydała w piątek KIMI K2, serię modeli AI open source, mającą na celu odzyskanie przywództwa rynku w konkurencyjnym sektorze AI w Chinach. Uruchomienie jest strategicznym posunięciem, aby rzucić wyzwanie rywalom, takim jak Deepseek i konkuruje na całym świecie z firmami amerykańskimi.

Kimi K2 to masywny model mieszanki ekspertów z 1 bilionem parametrów. Jest specjalnie zaprojektowany do „inteligencji agencyjnej”, umożliwiając autonomiczne wykonywanie złożonych zadań i korzystanie z narzędzi cyfrowych. Moonshot podkreśla zdolność KIMI K2 do działania, a nie tylko czat, ustawiając ją jako potężne nowe narzędzie dla programistów .

wydanie z 11 lipca oznacza ważny moment dla start-lalibaba-backed. Moonshot AI, założony w 2023 roku przez absolwenta Uniwersytetu Tsinghua, Moonsshot AI szybko zyskał na znaczeniu, ale jego pozycja rynkowa została niedawno zakwestionowana przez agresywne ruchy lokalnych konkurentów. To uruchomienie jest bezpośrednią i silną odpowiedzią.

Strategiczny gambit w Chinach zaciekłego AI Wars

Baza użytkowników księżyca do jego aplikacji KIMI zaobserwowała, że ​​jego ranking spadł z trzeciej do siódmej w Chinach między sierpniem 2024 r. A czerwca 2025 r.. Ten spadek nastąpił po zakłóceniu niskopoziomowych modeli przez Rival Deepseek, która zintensyfikowała domową cenę AI i wydajność. Wydanie KIMI K2 stanowi wyraźną próbę odwrócenia tego trendu.

poprzez otwarcie flagowego modelu Moonshot przyjmuje strategię coraz bardziej uprzywilejowaną przez chińskie firmy technologiczne. Podejście to pomaga budować szeroką społeczność programistów i zwiększa globalne wpływy, służąc jako potężny środki zaradcze wobec amerykańskich ograniczeń technologicznych. To gambit, aby zdobyć serca i umysły za pośrednictwem kodu.

Firma wypuszcza model pod Zmodyfikowana licencja na MIT , zachęcanie do adopcji i eksperymentalne. Ten ruch ma na celu przywrócenie Kimi jako platformy dla programistów, obstawianie, że lepsza zdolność i otwarty ekosystem mogą odzyskać udział w rynku.

Wydajność odniesienia i pozycja konkurencyjna

Według danych dotyczących wyników opublikowanych przez AI księżyca, AI, model Kimi-K2-instruct był oceniany w stosunku do innych wiodących modelek otwartych i wypowiedzi. zadania. Wyniki wskazują na wydajność konkurencyjną w kilku kluczowych obszarach, w tym w kodowaniu, użyciu narzędzia i złożonym rozumowaniu.

W testach porównawczych KIMI K2 osiągnął wynik 53,7 na LiveCodeBench V6, w porównaniu do 47,4 dla Claude Opus 4 i 44,7 dla GPT-4,1. W sprawdzonym teście kodowania Agentic, weryfikowanym, jego jednolita dokładność wynosiła 65,8%, umieszczając ją powyżej 38,8%Deepseek-V3, a 54,6%GPT-4.1, jednocześnie wynosząc wynik Claude Sonnet 4 wynoszący 72,7%.

Możliwości modelu w narzędzia były testowane na terenach modelu. W zadaniu telekomunikacyjnym TAU2 KIMI K2 zdobył 65,8, co było wyższe niż zgłoszone wyniki dla GPT-4.1 (38,6) i Claude Sonnet 4 (45,2). Sugeruje to silne zdolność do interfejsu z zewnętrznymi narzędziami do uzupełnienia celów.

W przypadku matematyki i rozumowania KIMI K2 wykazał również silne wyniki. W odniesieniu do konkurencji matematycznej AIME 2024 jego wynik 69,6 był wyższy niż w wyniku Flash Gemini 2.5 (61,3) i Claude Opus 4 (48,2). Podobnie, w teście rozumowania GPQA-diamond, jego wynik 75,1 nieznacznie przekroczył 74,9 Claude Opus 4.

w sprawie oceny wiedzy ogólnej, takich jak punkt odniesienia MMLU, KIMI K2 uzyskał 89,5. Stawia to w ścisłej konkurencji z innymi modelami Frontier, a GPT-4.1 zdobył 90,4, a Claude Opus 4 osiągnął 92,9. Łącznie dane sugerują, że KIMI K2 jest bardzo zdolnym modelem, szczególnie w kategorii open source.

Pod maską: modele z mostu z parametrem z parametrem z parametrem zbudowanym do działania

kimi k2is a mieszanka ekranów (mOE)). href=”https://moonshotai.github.io/kimi-k2/”target=”_ puste”> 32 miliardy są aktywowane dla dowolnego tokena . Ta architektura, podobna do tej używanej przez rywala Deepseek-V3, jest zaprojektowana do wydajności obliczeniowej w masywnej skali, kluczowego czynnika praktycznego wdrażania.

Architektura modelu obsługuje długość kontekstu 128k i wielkość słownictwa 160K. Zawiera 384 odrębnych ekspertów, a osiem wybrano do przetwarzania każdego tokena, umożliwiając wysoce wyspecjalizowane i wydajne obliczenia. Ta konstrukcja jest wynikiem analizy skalowania prawa mających na celu maksymalizację wydajności tokena.

Model został wstępnie wyszkolony na 15,5 bilionach tokenów danych. Aby zarządzać tym procesem bez niepowodzenia, Moonshot opracował nowy optymalizator „MuonClip”. Ta technika jest ewolucją jej wcześniejsze prace nad optymalizatorem miona , które przewyższa standardowe optymalizator adamw, ale może ucierpnąć z powodu instange na skalę.

Muonclip został stworzony konkretnie, aby zapobiec standardowej uwagi. które mogą wykoleić rozwój modeli na dużą skalę. Firma informuje, że ta metoda pozwoliła jej ukończyć cały 15,5t trenujący trening tokenów z „Zero Training Spike”, podkreślając jego odporność.

Poza podstawową architekturą, zdolności agencyjne KIMI K2 zostały dopracowane poprzez wyrafinowany rurociąg z syntezą danych. System ten symuluje scenariusze w świecie rzeczywistym z tysiącami narzędzi, w tym te kompatybilne z modelowym protokołem kontekstowym (MCP), w celu wygenerowania wysokiej jakości danych szkoleniowych opartych na rubrykach do użytku narzędzi.

Ponadto, Moonshot zastosował system „ogólnego uczenia się wzmocnienia”. Obejmuje to mechanizm samodzielny, w którym model działa jako własny krytyk, aby przekazywać informacje zwrotne na temat zadań z niezweryfikowalnymi nagrodami, takimi jak pisanie raportu, kluczowym krokiem w rozwoju bardziej ogólnych i niezawodnych umiejętności agencyjnych.

strzały Moonsstict to . Kimi-K2-baza jest podstawowym modelem, przeznaczonym dla badaczy, którzy potrzebują pełnej kontroli w celu dostrajania. Kimi-K2-instrukt to wersja po przeszkoleniu zoptymalizowana pod kątem czatu i opisana jako „model klasy odruchowej bez długiego myślenia” dla zadań agencyjnych out-of-box.

księżyca zapewnia dostęp do KIMI K2 APP , a „https://www.kimi..” href=”https://platform.moonshot.ai/target=”_ blank”> API programisty i Problem planuje zająć się .

globalna wyścig globalny dla analitycznej inteligencji

IS IS Is Puss is pushot. Inteligencja agresowa po podstawowej branży odejście od asystentów AI, którzy jedynie sugerują tekst lub kod. Agenci AI są zaprojektowane tak, aby zrozumieć cel, stworzyć plan i używać narzędzi do wykonywania złożonych, wieloetapowych zadań.

Wartość tego podejścia agencyjnego jest już zatwierdzana przez firmy. W przełomowym posunięciu Bank Investment Goldman Sachs właśnie zaczął pilotować autonomiczny koder AI Devin. Bank ma na celu zbudowanie „hybrydowej siły roboczej”, w której jego ludzcy inżynierowie nadzorują tysiące agentów AI.

Szef technologii Goldmana, Marco Argenti, wyjaśnił wizję, stwierdzając: „Naprawdę o ludziach i ais pracujących obok siebie. Inżynierowie będą oczekiwać, że będą mogli naprawdę opisać problemy i przekształcić ją w podpowiedź…” Siła robocza z Devinem, która będzie jak nasz nowy pracownik, który zacznie robić rzeczy w imieniu naszych programistów, „przesuwając ludzką koncentrację z żmudnego kodowania na nadzór na wysokim poziomie.

Ten trend nie ogranicza się do finansów. Szerszy rynek kodowania sztucznej inteligencji to pole bitwy, w którym Google uruchamia swojego agenta Julesa i bezpłatne CLI Gemini. Openai dał swojemu agentowi Codex Internet Access, chociaż dyrektor generalny Sam Altman ostrzegał użytkowników do „uważnie przeczytania ryzyka i użycia, gdy ma to sens”, potwierdzając nieodłączne ryzyko.

Tymczasem startupy koncentrują się na głębokiej integracji przepływu pracy. AnySphere, producent popularnego edytora kursora AI, niedawno uruchomił aplikację internetową do zarządzania agentami kodującymi z dowolnego urządzenia. Ta strategia „wielu powierzchni” ma na celu uczynienie AI stał się otoczeniem, zawsze obecnym współpracownikiem.

Categories: IT Info