Một mặt trận mới đã mở ra trong cuộc đua AI cổ phần cao của Trung Quốc. Khởi nghiệp Minimax có trụ sở tại Thượng Hải đã phát hành Minimax-M1, một mô hình lý luận trọng lượng mở mạnh mẽ, thực hiện một thách thức trực tiếp và đa hướng đến sự thống trị của đối thủ trong nước, Deepseek. Động thái này leo thang sự cạnh tranh khu vực từ Trận chiến điểm chuẩn đến một cuộc chiến phức tạp hơn đã chiến đấu về hiệu suất, hiệu quả chi phí và định nghĩa về nguồn mở của Hồi.”Theo Một báo cáo từ đăng ký Cho đến tuần này, mô hình R1-0528 đã nâng cấp Deepseek đã được xem là ứng cử viên nguồn mở hàng đầu của Trung Quốc. nhưng làm như vậy với hiệu quả cao hơn và theo giấy phép cho phép hơn.

Kho lưu trữ GitHub chính thức Chi tiết về một loại chi tiết. một lần. Mặc dù cả hai mô hình đều sử dụng kỹ thuật MOE tăng cường hiệu quả, cơ chế chú ý của Lightning chú ý về Lightning”và một thuật toán học củng cố mới được gọi là CISPO là sự khác biệt chính. Theo Tài liệu kỹ thuật chính thức Thiết kế này là nền tảng của hiệu quả của mô hình. So với DeepSeek, việc giảm đáng kể chi phí tính toán này giúp M1 hiệu quả hơn đáng kể trong cả đào tạo về suy luận và quy mô lớn.”Trong khi các điểm chuẩn tự báo cáo cho thấy một bức tranh sắc thái, với Deepseek duy trì một lợi thế nhỏ trong một số bài kiểm tra mã hóa, M1 M1 dường như tiến lên trong các tác vụ lý luận lâu dài, khả năng quan trọng cho các ứng dụng tinh vi.

Nhiều hơn một giấy phép: Gambit nguồn mở

Có lẽ di chuyển chiến lược nhất của Minimax là sự lựa chọn giấy phép. Công ty đã phát hành M1 theo Giấy phép Apache 2.0 , mà nó chỉ định khung hình thực sự là nguồn mở.”Đây là một sự cố có chủ ý tại các đối thủ cạnh tranh như Meta, có các mô hình llama sử dụng giấy phép cộng đồng hạn chế mà sáng kiến ​​nguồn mở lập luận là

Nếu tôi là Deepseek, tôi chắc chắn sẽ tạo ra một tấn dữ liệu tổng hợp từ mô hình API tốt nhất hiện có. Họ viết thiếu trên GPU và tuôn ra bằng tiền mặt. Nó có nghĩa đen là tính toán nhiều hơn cho họ. Có trên câu hỏi chưng cất Gemini.

-Nathan Lambert (@natolambert) Dữ liệu độc quyền và kiến ​​thức thể chế của riêng họ. Thách thức đối với Deepseek không chỉ là về các số liệu hiệu suất mà là một cuộc thi rộng lớn hơn về hiệu quả, chiến lược pháp lý và nhận thức được sự đáng tin cậy. Khi cuộc đua toàn cầu tiếp tục tăng tốc, cuộc cạnh tranh đa phía trước này ở Trung Quốc chứng minh rằng việc xây dựng mô hình AI chiếm ưu thế hiện đang đòi hỏi nhiều hơn là mã hóa, nó đòi hỏi sự thành thạo về sự tương tác phức tạp giữa công nghệ, đạo đức và thương mại.