Anthropic đã ra mắt một phi công cho Claude cho Chrome”, một tiện ích mở rộng trình duyệt mới cho phép AI của nó thực hiện hành động cho người dùng. Được công bố hôm nay, bản xem trước nghiên cứu được giới hạn ở 1.000 người dùng đáng tin cậy của dịch vụ cao cấp của mình. Việc di chuyển nhằm mục đích làm cho Claude hữu ích hơn bằng cách cho phép nó nhấp vào các nút và điền vào các biểu mẫu trực tuyến. Anthropic đang tiến hành thận trọng để giải quyết các mối đe dọa an ninh nghiêm trọng. Công ty tập trung vào việc ngăn chặn Các cuộc tấn công nhanh chóng của tiêm”, trong đó các lệnh ẩn trên trang web có thể lừa AI. Phi công bước vào một lĩnh vực cạnh tranh, với Openai, Microsoft và Google đều phát triển các tác nhân AI tương tự. href=”https://www.anthropic.com/news/claude-for-prom”target=”_ blank”> bước logic tiếp theo “trong sự phát triển của nó. Sau khi tích hợp với các phần mềm như lịch và tài liệu, cung cấp cho AI khả năng nhấp vào các nút và điền vào các biểu mẫu trực tiếp trong trình duyệt được xem như một cách để làm cho nó hữu ích hơn đáng kể.”

23,6% Tỷ lệ thành công tấn công Khi đại lý của nó được cố tình nhắm mục tiêu mà không có sự giảm thiểu an toàn mới nhất. Trong một ví dụ rõ ràng, một phiên bản Claude không được bảo vệ đã bị lừa bởi một email bảo mật giả, yêu cầu các email cần thiết để được xóa cho vệ sinh hộp thư.”Lời nhắc độc hại thậm chí đã khẳng định rằng, không cần xác nhận bổ sung.”Thí nghiệm nhấn mạnh cách một AI dễ dàng có thể được điều khiển thành các hành động phá hoại mà không có các biện pháp bảo vệ thích hợp. Dòng phòng thủ đầu tiên là quyền của người dùng; Người dùng có thể cấp hoặc thu hồi quyền truy cập của Claude vào các trang web cụ thể bất cứ lúc nào. Đại lý cũng được thiết kế để yêu cầu xác nhận trước khi thực hiện các hành động có rủi ro cao như xuất bản nội dung hoặc chia sẻ dữ liệu cá nhân, ngay cả khi hoạt động trong chế độ tự trị thử nghiệm của nó.”Với những giảm thiểu mới này, tỷ lệ thành công tấn công tổng thể đã giảm từ 23,6% xuống còn 11,2%. Trên một thử thách của một người khác”, bộ bốn loại tấn công cụ thể của trình duyệt như vậy, các hệ thống phòng thủ mới đã giảm ấn tượng với tỷ lệ thành công tấn công từ 35,7% xuống 0%.

Những mối đe dọa này không chỉ đơn thuần là lý thuyết. Các nhà nghiên cứu tại Brave gần đây đã phát hiện ra một thế giới thực href=”https://thehackernews.com/2025/08/experts-find-ai-rowerers-can-be.html”Target=”_ Blank”> Khai thác có thể hoạt động

Di chuyển nhân học làm nóng cuộc đua giữa những người khổng lồ công nghệ để phát triển AI của tác nhân. Openai đã ra mắt đại lý Chatpt mạnh mẽ của mình vào tháng 7 năm 2025, đã được quan sát qua việc bỏ qua các bài kiểm tra bảo mật của tôi. Người tiền nhiệm, nhà điều hành giới hạn hơn của nó, đã được giới thiệu vào tháng 1.

Microsoft cũng là một người chơi chính. Nó đã ra mắt chế độ Copilot thử nghiệm”cho trình duyệt Edge vào tháng 7 có thể hiểu ngữ cảnh trên tất cả các tab mở. Chiến lược là nhúng AI sâu vào hệ sinh thái trình duyệt hiện có. Mục tiêu là một cộng tác viên liền mạch, như Microsoft, Sean Lyndersay nói, rằng, không chỉ cung cấp cho bạn những tab vô tận để sàng lọc nhưng hoạt động với bạn như một cộng tác viên có ý nghĩa của tất cả.”Perplexity đã ra mắt trình duyệt sao chổi cao cấp vào tháng 7, trong khi Opera tiết lộ trình duyệt neon đại lý của mình vào tháng 5, cả hai đều nhằm xác định lại điều hướng web từ đầu. Công ty đang lặng lẽ phát triển tác nhân sử dụng máy tính của riêng mình”trong AI Studio của mình, báo hiệu ý định cạnh tranh trong lĩnh vực mới này. Một nghiên cứu tháng 5 năm 2025 từ Đại học Carnegie Mellon nhận thấy rằng ngay cả các đại lý AI hàng đầu cũng đấu tranh với các nhiệm vụ tự động hóa kinh doanh phức tạp. Nghiên cứu lưu ý rằng thiếu ý thức chung và tỷ lệ thành công thấp.

Sự hoài nghi này được chia sẻ bởi một số nhà lãnh đạo trong ngành. Giám đốc điều hành Perplexity Aravind Srinivas đã thúc giục thận trọng, nói rằng, bất cứ ai nói rằng các đại lý sẽ làm việc vào năm 2025 nên hoài nghi.”Điều này phản ánh khoảng cách đáng kể giữa việc chứng minh khả năng và triển khai nó một cách đáng tin cậy và an toàn ở quy mô. Trưởng nhóm nghiên cứu của Openai, Isa Fulford lưu ý rằng đại lý của họ cần có sự cho phép cho các hành động không thể đảo ngược, giải thích rằng, trước khi đại lý của nhà thờ làm bất cứ điều gì không thể đảo ngược, như gửi email hoặc đặt chỗ, nó yêu cầu cho phép trước.”

Anthropic. Mặc dù lời hứa của một AI có thể quản lý cuộc sống kỹ thuật số của chúng ta là hấp dẫn, ngành công nghiệp thừa nhận rằng thời đại của các đại lý thực sự tự trị, đáng tin cậy vẫn chưa đến.

Categories: IT Info