Công ty an toàn AI Anthropic đã ra mắt Claude Haiku 4.5, một mô hình mới gói gọn sức mạnh của AI tiên tiến một thời vào một khung máy nhanh hơn và rẻ hơn nhiều.
Được phát hành vào ngày 15 tháng 10 năm 2025, Haiku 4.5 phù hợp với hiệu suất mã hóa của mô hình Sonnet 4 5 tháng tuổi của công ty với chi phí chỉ bằng 1/3 và tốc độ nhanh hơn gấp đôi.
Anthropic đang nhắm mục tiêu đến các nhà phát triển yêu cầu hiệu suất tốc độ cao, độ trễ thấp cho các ứng dụng như trợ lý trò chuyện thời gian thực và các công cụ lập trình ghép nối.
Mô hình này có sẵn trên toàn cầu thông qua API của Anthropic, Amazon Bedrock và Vertex AI của Google Cloud, cung cấp tùy chọn tiết kiệm chi phí cho khối lượng công việc AI có thể mở rộng.
Việc ra mắt này phản ánh một xu hướng chính của ngành: quá trình thương mại hóa nhanh chóng các khả năng AI tiên tiến. Những gì được coi là hiệu suất vượt trội chỉ vài tháng trước hiện đang được dân chủ hóa, thay đổi phép tính kinh tế cho các nhà phát triển xây dựng các ứng dụng hỗ trợ AI.
Dân chủ hóa biên giới: Tốc độ và sức mạnh trong ngân sách
Điểm hấp dẫn cốt lõi của Haiku 4.5 nằm ở tỷ lệ hiệu suất giá cao. Với giá chỉ 1 USD trên một triệu token đầu vào và 5 USD trên một triệu cho đầu ra, nó cắt giảm đáng kể chi phí của những người anh em mạnh mẽ hơn của nó.
Điều này khiến nó trở thành sự thay thế trực tiếp, tiết kiệm chi phí cho cả hai mẫu Haiku 3.5 và Sonnet 4 cũ hơn.
Hiệu suất của nó không chỉ là một sự cải thiện nhỏ. Trên SWE-bench Verify, một bài kiểm tra nghiêm ngặt về khả năng mã hóa trong thế giới thực, Haiku 4.5 đạt 73,3%, vượt qua mức 72,7% mà Sonnet 4 đắt tiền hơn nhiều đạt được. Điều này chứng tỏ các nhà phát triển không phải hy sinh chất lượng để lấy tốc độ.
Mô hình này tự hào có cửa sổ ngữ cảnh 200.000 mã thông báo và ngưỡng kiến thức đến tháng 2 năm 2025, đảm bảo mô hình có thể xử lý các quy mô lớn, phức tạp nhiệm vụ với thông tin cập nhật.
Sự kết hợp giữa tốc độ, sức mạnh và chi phí thấp này báo hiệu ý định của Anthropic trong việc nắm bắt phân khúc thị trường AI có khối lượng lớn, theo thời gian thực.
Nhân vật chủ chốt trong tương lai đa tác nhân
Ngoài khả năng độc lập, Anthropic định vị Haiku 4.5 như một thành phần quan trọng trong hệ sinh thái đa tác nhân rộng lớn hơn. Công ty hình dung ra một quy trình làm việc trong đó mô hình biên giới của họ, Claude Sonnet 4.5, đóng vai trò là người quản lý dự án, chia nhỏ các vấn đề phức tạp thành các phần nhỏ hơn.
Sau đó, những nhiệm vụ phụ này có thể được giao cho một nhóm phiên bản Haiku 4.5 hoạt động song song. Cách tiếp cận đa mô hình này cho phép tạo ra một phương pháp hiệu quả cao và có thể mở rộng để giải quyết các nhiệm vụ tác nhân quy mô lớn, từ phát triển phần mềm đến phân tích dữ liệu phức tạp.
Chiến lược này phản ánh sự hiểu biết của Anthropic về tương lai của hoạt động phát triển AI. Một mô hình nguyên khối duy nhất thường kém hiệu quả hơn so với một nhóm AI chuyên biệt được phối hợp. Nó cung cấp một khuôn khổ thực tế để xây dựng loại hệ thống tự trị đã được thảo luận trước đây trong phạm vi bảo hiểm của chúng tôi về Sonnet 4.5.
Một tiêu chuẩn mới về An toàn và khả năng tiếp cận của mô hình
Trong một động thái cân bằng khả năng một cách thận trọng, Anthropic đã phát hành Haiku 4.5 trong khuôn khổ An toàn AI Cấp 2 (ASL-2). Đây là tiêu chuẩn ít hạn chế hơn so với ASL-3 áp dụng cho Sonnet 4.5, phản ánh đánh giá của công ty rằng mô hình nhỏ hơn gây ra nhiều rủi ro hạn chế hơn.
Theo đánh giá an toàn nội bộ của Anthropic, Haiku 4.5 cho thấy tỷ lệ hành vi sai lệch hoặc có hại thấp hơn đáng kể so với các phiên bản trước. Công ty khẳng định, theo một số chỉ số, đây là mô hình an toàn nhất và phù hợp nhất cho đến nay, là điểm bán hàng quan trọng đối với khách hàng doanh nghiệp.
Mô hình này có sẵn ngay lập tức trên các nền tảng đám mây lớn như AWS và Google Cloud tiếp tục hạ thấp rào cản gia nhập đối với các nhà phát triển. Sự phân phối rộng rãi này, kết hợp với cấu hình an toàn và hiệu suất hấp dẫn, giúp Haiku 4.5 trở thành một lựa chọn mới đáng gờm trong thị trường AI đầy cạnh tranh.