Moonshot AI có trụ sở tại Bắc Kinh đã phát hành Kimi K2 vào thứ Sáu, một loạt mô hình AI nguồn mở nhằm mục đích đòi lại sự lãnh đạo thị trường trong bối cảnh AI cạnh tranh của Trung Quốc. Sự ra mắt là một động thái chiến lược để thách thức các đối thủ như Deepseek và cạnh tranh toàn cầu với các công ty Hoa Kỳ.
Kimi K2 là một mô hình hỗn hợp lớn với 1 nghìn tỷ tham số. Nó được thiết kế đặc biệt cho trí thông minh tác nhân của người Viking,”cho phép nó tự chủ thực hiện các nhiệm vụ phức tạp và sử dụng các công cụ kỹ thuật số. Moonshot nhấn mạnh khả năng hành động của Kimi K2, không chỉ trò chuyện, định vị nó là Công cụ mới mạnh mẽ cho các nhà phát triển . Được thành lập vào năm 2023 bởi tốt nghiệp Đại học Tsinghua Yang Zhilin, Moonshot AI nhanh chóng đạt được sự nổi bật, nhưng thị trường của nó gần đây đã bị thách thức bởi những động thái tích cực từ các đối thủ cạnh tranh địa phương. Sự ra mắt này là một phản ứng trực tiếp và mạnh mẽ. src=”Dữ liệu: Image/SVG+XML; Aiihdpzhropsixmjgwiibozwlnahq9ijcymcigeg1sbnm9imh0dha6ly93d3cudzmub3jnlziwmdavc3znij48l3n2zz4=”>
Một gambit chiến lược ở Trung Quốc, AI Wars khốc liệt
cơ sở người dùng Moonshot, cho ứng dụng KIMI của mình đã chứng kiến thứ hạng của nó trượt từ thứ ba xuống thứ bảy tại Trung Quốc từ tháng 8 năm 2024 và tháng 6 năm 2025. Bản phát hành Kimi K2 là một giá thầu rõ ràng để đảo ngược xu hướng này. Cách tiếp cận này giúp xây dựng một cộng đồng nhà phát triển rộng lớn và mở rộng ảnh hưởng toàn cầu, phục vụ như một biện pháp đối phó mạnh mẽ đối với các hạn chế công nghệ của Hoa Kỳ. Đó là một gambit để giành được trái tim và tâm trí thông qua mã. Động thái này nhằm mục đích thiết lập lại KIMI như một nền tảng cho các nhà phát triển, đặt cược rằng khả năng vượt trội và hệ sinh thái mở có thể giành lại thị phần. Nhiệm vụ. Kết quả cho thấy hiệu suất cạnh tranh trong một số lĩnh vực chính, bao gồm mã hóa, sử dụng công cụ và lý luận phức tạp. Trong bài kiểm tra mã hóa tác nhân được xác minh, độ chính xác của một người tham gia là 65,8%, đặt nó lên trên DeepSeek-V3, 38,8%và GPT-4,1, 54,6%, trong khi theo dõi điểm số của Claude Sonnet 4,7%.
Đối với toán học và lý luận, Kimi K2 cũng chứng minh kết quả mạnh mẽ. Trên điểm chuẩn thi đấu AIME 2024, điểm số 69,6 cao hơn so với FLASH FLASH 2.5 (61.3) và Claude Opus 4 (48.2). Tương tự, trong bài kiểm tra lý luận GPQA-Diamond, điểm số 75,1 của nó hơi vượt quá Claude Opus 4, 74.9. Điều này đặt nó cạnh tranh chặt chẽ với các mô hình Frontier khác, với GPT-4.1 ghi được 90,4 và Claude Opus 4 đạt được 92.9. Nói chung, dữ liệu cho thấy Kimi K2 là một mô hình có khả năng cao, đặc biệt là trong danh mục nguồn mở. href=”https://moonshotai.github.io/kimi-k2/”target=”_ blank”> 32 tỷ được kích hoạt cho bất kỳ mã thông báo nào được cung cấp . Kiến trúc này, tương tự như được sử dụng bởi đối thủ Deepseek-V3, được thiết kế để có hiệu quả tính toán ở quy mô lớn, một yếu tố chính để triển khai thực tế. Nó có 384 chuyên gia riêng biệt, với tám chuyên gia được chọn để xử lý từng mã thông báo, cho phép tính toán chuyên môn và hiệu quả cao. Thiết kế này là kết quả của phân tích quy mô quy mô nhằm mục đích tối đa hóa hiệu quả mã thông báo. Để quản lý quá trình này mà không bị thất bại, Moonshot đã phát triển một trình tối ưu hóa mới lạ”MUONCLIP”. Kỹ thuật này là một sự phát triển của Công việc trước đó trên trình tối ưu hóa muon Điều đó có thể làm hỏng sự phát triển mô hình quy mô lớn. Công ty báo cáo rằng phương pháp này cho phép nó hoàn thành toàn bộ hoạt động đào tạo mã thông báo 15,5T với tăng đột biến của Zero Zero,”làm nổi bật sự mạnh mẽ của nó. Hệ thống này mô phỏng các kịch bản trong thế giới thực với hàng ngàn công cụ, bao gồm các công cụ tương thích với Giao thức bối cảnh mô hình (MCP), để tạo dữ liệu đào tạo dựa trên chất lượng cao, dựa trên phiếu tự đánh giá để sử dụng công cụ.
Điều này liên quan đến một cơ chế tự phán xét trong đó mô hình đóng vai trò là nhà phê bình của chính mình để cung cấp phản hồi về các nhiệm vụ với phần thưởng không thể xác định được, chẳng hạn như viết một báo cáo, một bước quan trọng trong việc phát triển các kỹ năng đại lý tổng quát và đáng tin cậy hơn. Phiên bản của mô hình . Kimi-K2-Base là mô hình nền tảng, dành cho các nhà nghiên cứu cần kiểm soát hoàn toàn để tinh chỉnh. Kimi-K2-Instruct là phiên bản được đào tạo sau khi trò chuyện và được mô tả như một mô hình cấp phản xạ của người Viking mà không cần suy nghĩ lâu dài”cho các tác vụ tác nhân ngoài hộp. href=”https://platform.moonshot.ai/”target=”_ blank”> API nhà phát triển và
Xu hướng này không giới hạn ở tài chính. Thị trường mã hóa AI rộng hơn là một chiến trường, với việc Google ra mắt đại lý Jules và Gemini CLI miễn phí. Openai đã cho phép truy cập internet đại lý Codex của mình, mặc dù Giám đốc điều hành Sam Altman đã cảnh báo người dùng về việc đọc về các rủi ro và sử dụng một cách cẩn thận khi có ý nghĩa”, việc thừa nhận các rủi ro vốn có. AnySphere, nhà sản xuất của Trình chỉnh sửa AI con trỏ nổi tiếng, gần đây đã ra mắt một ứng dụng web để quản lý các tác nhân mã hóa của mình từ bất kỳ thiết bị nào. Chiến lược đa bề mặt”này nhằm mục đích biến AI thành cộng tác viên xung quanh, luôn hiện diện.