Một mặt trận mới đã mở ra trong cuộc đua AI cổ phần cao của Trung Quốc. Khởi nghiệp Minimax có trụ sở tại Thượng Hải đã phát hành Minimax-M1, một mô hình lý luận trọng lượng mở mạnh mẽ, thực hiện một thách thức trực tiếp và đa hướng đến sự thống trị của đối thủ trong nước, Deepseek. Động thái này leo thang sự cạnh tranh khu vực từ Trận chiến điểm chuẩn đến một cuộc chiến phức tạp hơn đã chiến đấu về hiệu suất, hiệu quả chi phí và định nghĩa về nguồn mở của Hồi.”Theo Một báo cáo từ đăng ký Cho đến tuần này, mô hình R1-0528 đã nâng cấp Deepseek đã được xem là ứng cử viên nguồn mở hàng đầu của Trung Quốc. nhưng làm như vậy với hiệu quả cao hơn và theo giấy phép cho phép hơn.
Kho lưu trữ GitHub chính thức Chi tiết về một loại chi tiết. một lần. Mặc dù cả hai mô hình đều sử dụng kỹ thuật MOE tăng cường hiệu quả, cơ chế chú ý của Lightning chú ý về Lightning”và một thuật toán học củng cố mới được gọi là CISPO là sự khác biệt chính. Theo Tài liệu kỹ thuật chính thức Thiết kế này là nền tảng của hiệu quả của mô hình. So với DeepSeek, việc giảm đáng kể chi phí tính toán này giúp M1 hiệu quả hơn đáng kể trong cả đào tạo về suy luận và quy mô lớn.”Trong khi các điểm chuẩn tự báo cáo cho thấy một bức tranh sắc thái, với Deepseek duy trì một lợi thế nhỏ trong một số bài kiểm tra mã hóa, M1 M1 dường như tiến lên trong các tác vụ lý luận lâu dài, khả năng quan trọng cho các ứng dụng tinh vi.
Có lẽ di chuyển chiến lược nhất của Minimax là sự lựa chọn giấy phép. Công ty đã phát hành M1 theo Giấy phép Apache 2.0 , mà nó chỉ định khung hình thực sự là nguồn mở.”Đây là một sự cố có chủ ý tại các đối thủ cạnh tranh như Meta, có các mô hình llama sử dụng giấy phép cộng đồng hạn chế mà sáng kiến nguồn mở lập luận là