Nhân học tiết lộ Khung khả năng diễn giải để làm cho Claude từ AI lý luận minh bạch hơn

Anthropic đã giới thiệu một khung khả năng diễn giải mới được thiết kế để phơi bày các hoạt động bên trong của mô hình ngôn ngữ của nó Claude, vượt xa các phương pháp gỡ lỗi truyền thống. Công ty tuyên bố bây giờ có thể theo dõi những gì mô hình là ‘suy nghĩ về những gì tính toán mà nó hoạt động trong nội bộ để đi đến một đầu ra nhất định.

Tao bổ sung cho kiến trúc phát triển của Claude. Vào tháng 2, Anthropic đã phát hành Claude 3.7 Sonnet, một mô hình lý luận có khả năng chuyển đổi giữa các phản ứng nhanh, chính xác thấp và suy nghĩ phân tích sâu hơn, chậm hơn. Các nhà phát triển có thể định cấu hình hành vi này thông qua ngân sách mã thông báo,”Chỉ ra số lượng mô hình sẽ phản ánh trước khi trả lời. Mã Claude là một cộng tác viên hoạt động có thể tìm kiếm và đọc mã, chỉnh sửa các tệp, ghi và chạy các bài kiểm tra, cam kết và đẩy mã vào GitHub và sử dụng các công cụ dòng lệnh”, công ty nêu trong cùng một bản phát hành. Nó dẫn đến mã hóa tác nhân (được xác minh băng ghế SWE), sử dụng công cụ (băng ghế tau) và hướng dẫn theo sau (ifeval), theo số liệu của chính Anthropic. Đối với người dùng Claude Pro và nhóm có trụ sở tại Hoa Kỳ, tính năng lấy dữ liệu thời gian thực và đính kèm các trích dẫn nguồn, một cái gì đó bị thiếu trong nhiều hệ thống AI cạnh tranh. Mục tiêu là để cân bằng sản lượng tổng quát với các nguồn có thể kiểm chứng, có thể truy tìm con người, mở rộng sáng kiến minh bạch của công ty. Giao thức bối cảnh mô hình của công ty (MCP) đã được giới thiệu vào tháng 11 năm 2024, cung cấp một cách tiêu chuẩn hóa cho các hệ thống AI tương tác với các cửa hàng, công cụ và API bộ nhớ. Microsoft đã thêm hỗ trợ cho MCP trong Azure AI Foundry, Semantic Kernel và GitHub trong tuần này, cho phép các tác nhân dựa trên Claude xây dựng và thực hiện các quy trình nhiều bước với sự kiên trì. Khi một mô hình thực hiện các hành động trong thế giới thực, việc hiểu lý do tại sao nó đưa ra một lựa chọn cụ thể chỉ là học thuật, đó là một yêu cầu. Vào tháng Hai, công ty đã huy động được 3,5 tỷ đô la, tăng định giá lên 61,5 tỷ đô la. Các nhà đầu tư bao gồm các đối tác liên doanh Lightspeed, Chất xúc tác chung và MGX. Amazon, trước đó, khoản đầu tư 4 tỷ đô la trước đó đã củng cố thêm sự hiện diện của Claude trên cơ sở hạ tầng AWS. Mặc dù các đối thủ tập trung vào tích hợp đa phương thức hoặc tìm kiếm trực tiếp, nhân học đang đặt danh tiếng của mình vào sự liên kết của doanh nghiệp và minh bạch hành vi AI.

Chiến lược đó cũng rõ ràng trong chính sách. Trong tháng này, công ty đã gửi các khuyến nghị chính thức cho Nhà Trắng, kêu gọi thử nghiệm an ninh quốc gia của các hệ thống AI, kiểm soát xuất khẩu bán dẫn chặt chẽ hơn và mở rộng cơ sở hạ tầng năng lượng của Hoa Kỳ để hỗ trợ tăng khối lượng công việc AI. Nó cảnh báo rằng AI tiên tiến có thể vượt qua khả năng của con người trong các lĩnh vực quan trọng vào năm 2026, việc đặt rủi ro nếu các biện pháp bảo vệ được ban hành nhanh chóng.

Công ty đã không bình luận công khai về sự đảo ngược này, mặc dù nó đã gây ra những lo ngại về việc thay đổi các quy tắc của ngành xung quanh việc tự điều chỉnh. Như đã báo cáo bởi

Nhân học tiết lộ Khung khả năng diễn giải để làm cho Claude từ AI lý luận minh bạch hơn

Published by All Things Windows on March 28, 2025

IT Info

Google đẩy Gemini 2.5 Pro cho mọi người-không cần đăng ký

IT Info

ZHIPU AI đẩy xa hơn vào cuộc đua đại lý AI của Trung Quốc với sự ra mắt Autoglm miễn phí

IT Info

Cách khắc phục sự cố nâng cấp Windows 11 (Hướng dẫn đầy đủ).

Nhân học tiết lộ Khung khả năng diễn giải để làm cho Claude từ AI lý luận minh bạch hơn

Published by All Things Windows on March 28, 2025

Related Posts

IT Info

Google đẩy Gemini 2.5 Pro cho mọi người-không cần đăng ký

IT Info

ZHIPU AI đẩy xa hơn vào cuộc đua đại lý AI của Trung Quốc với sự ra mắt Autoglm miễn phí

IT Info

Cách khắc phục sự cố nâng cấp Windows 11 (Hướng dẫn đầy đủ).