Khởi nghiệp AI Trung Quốc Moonshot AI đã tăng cường tham vọng của quốc gia AI với bản phát hành ngày 1 tháng 8 của Kimi-K2-Turbo Preview. Phiên bản tốc độ cao mới của mô hình KIMI K2 của nó tăng sản lượng bốn lần lên 40 token mỗi giây, một thách thức trực tiếp đối với các đối thủ trong nước và toàn cầu. Sự thống trị. Đó là một giá thầu chiến lược để giành chiến thắng trước các nhà phát triển trong cuộc đua toàn cầu về AI tự trị hơn, AGE, trong đó tốc độ suy luận đang trở nên quan trọng như sức mạnh thô. src=”Dữ liệu: Image/SVG+XML; Aiihdpzhropsixmjgwiibozwlnahq9ijcymcigeg1sbnm9imh0dha6ly93d3cudzmub3jnlziwmdavc3znij48l3n2zz4=”>

Kimi K2 Turbo: Nhu cầu chiến lược về tốc độ

Mô hình tốc độ cao mới là một tối ưu hóa quan trọng, không phải là sự thay thế. Nó duy trì các thông số mạnh mẽ tương tự như Kimi K2 ban đầu, một mô hình tham số một triệu lớn được phát hành lần đầu tiên vào ngày 11 tháng 7. Sự khác biệt chính là sự gia tăng mạnh mẽ về tốc độ suy luận, một số liệu quan trọng cho các ứng dụng trong thế giới thực. Điều này cung cấp cho người dùng trải nghiệm mượt mà và hiệu quả hơn. Công ty tuyên bố bản phát hành chỉ là Bắt đầu các nỗ lực tối ưu hóa của nó . Trong thời gian giảm giá, giá trên một triệu mã thông báo là ¥ 8,00 cho đầu vào và ¥ 32,00 cho đầu ra. Điều này tập trung vào tốc độ và chi phí báo hiệu một sự thay đổi chiến lược vượt ra ngoài quyền lực tối cao đối với khả năng sử dụng thực tế và áp dụng nhà phát triển.

Tập trung vào tốc độ này là một phản ứng trực tiếp đối với động lực thị trường. Khi các mô hình AI trở nên mạnh mẽ hơn, khả năng đáp ứng là một điểm khác biệt chính. Một mô hình nhanh hơn cải thiện trải nghiệm người dùng cho các ứng dụng tương tác như Moonshot, riêng

Cuộc chiến giá đang leo thang nhanh chóng. Vào cuối tháng 7, khởi nghiệp Z.AI (trước đây là ZHIPU) đã ra mắt các mẫu GLM-4,5 mạnh mẽ của mình, rõ ràng làm giảm Deepseek về chi phí. Giá cả tiêu chuẩn này buộc các công ty phải đổi mới về hiệu quả, không chỉ là sức mạnh thô. Cuộc chiến về hiệu suất cũng rất khốc liệt, với người khổng lồ công nghệ Alibaba gần đây đã phát hành mô hình QWEN3 để nắm bắt không gian mã hóa tác nhân. Buổi ra mắt của Alibaba đã bị che mờ bởi các cáo buộc rằng mô hình QWEN2.5 trước đây của nó đã bị lừa”trên các điểm chuẩn chính bằng cách ghi nhớ dữ liệu thử nghiệm. Cuộc tranh cãi này nhấn mạnh một rủi ro hệ thống, như chiến lược gia AI Nate Jones đã lưu ý, khoảnh khắc chúng tôi đặt sự thống trị của bảng xếp hạng là mục tiêu, chúng tôi có nguy cơ tạo ra các mô hình vượt trội trong các bài tập tầm thường và cá bơn khi đối mặt với thực tế.”Chính phủ Hoa Kỳ đã bày tỏ mối quan tâm sâu sắc đối với sự phát triển AI của Trung Quốc, với Chủ tịch Ủy ban Hạ viện John Moolenaar mô tả một công ty đối thủ là một vũ khí trong Đảng Cộng sản Trung Quốc Arsenal Arsenal,”nhấn mạnh các cổ phần cao. Áp lực này buộc các công ty Trung Quốc phải đổi mới trong các ràng buộc đáng kể, chẳng hạn như hoạt động của Z.AI trong khi nằm trong danh sách thực thể Hoa Kỳ. Z.AI đã biến điều này thành một lợi thế chiến lược, kỹ thuật các mô hình của nó về hiệu quả trên phần cứng này. Động thái này đặc biệt sắc nét khi mô hình R2 thế hệ tiếp theo của Deepseek, được báo cáo là bị đình trệ do tình trạng thiếu phần cứng mà Z.AI đã điều hướng. Đó là một cách tiếp cận đa hướng được thiết kế để chống lại áp lực bên ngoài và đòi lại thị phần trong nước bằng cách thể hiện sự vượt trội trong các số liệu quan trọng nhất đối với người dùng: tốc độ, chi phí và hiệu suất thực tế. Ngành công nghiệp đang vượt ra ngoài các chatbot đơn giản để tạo ra các tác nhân tự trị có thể hiểu mục tiêu, đưa ra kế hoạch và sử dụng các công cụ để hoàn thành các nhiệm vụ nhiều bước phức tạp. từ sự thành lập của nó. Phiên bản Turbo mới làm cho tầm nhìn đó thực tế hơn đối với các ứng dụng trong thế giới thực bằng cách giảm độ trễ có thể cản trở quy trình làm việc của các tác nhân phức tạp.

Xu hướng này đã được xác nhận trong doanh nghiệp. Ngân hàng đầu tư Goldman Sachs gần đây đã bắt đầu thí điểm Đại lý AI Devin để xây dựng một lực lượng lao động lai của người Hồi giáo”, một bước đi mang tính bước ngoặt cho Phố Wall. Điều này phản ánh một tương lai mà con người giám sát các tác nhân AI, chuyển trọng tâm từ việc thực hiện tẻ nhạt sang giải quyết vấn đề cấp cao. Nó đang tạo ra một lối chơi chiến lược cho sự thống trị trong kỷ nguyên tác nhân mới này, cá cược rằng trong một thế giới của các mô hình mạnh mẽ, nhanh nhất, hiệu quả nhất và có thể truy cập nhất cuối cùng sẽ giành chiến thắng.