Alibaba đang tăng tốc cuộc đua AI toàn cầu với Websailor, một đại lý web nguồn mở mới được phát hành vào ngày 4 tháng 7. Công ty tuyên bố đại lý của mình thu hẹp khoảng cách hiệu suất với các hệ thống độc quyền hàng đầu từ các đối thủ cạnh tranh như Openai. Bản phát hành chiến lược này,

Trọng tâm của Websailor là một chiến lược đào tạo tinh vi được thiết kế để dạy các mô hình cách xử lý sự mơ hồ. Cách tiếp cận vượt ra ngoài câu hỏi đơn giản, thay vào đó tập trung vào cái mà các nhà nghiên cứu gọi là cấp 3″Các vấn đề: Các nhiệm vụ không có đường dẫn giải pháp rõ ràng đòi hỏi phải khám phá sâu. src=”Dữ liệu: Image/SVG+XML; IIb3Awr0ad0Imty1NiigAgvpZ2H0psixNTEYIIB4BWXUCZ0IAHR0CDOVL3D3DY53MY5VCMCVMJAWMC9ZDMCIPJWVC3ZNPG==”

Để tạo ra những thách thức này, nhóm đã tạo

Dữ liệu này được sử dụng trong chế độ đào tạo hai giai đoạn. Nó bắt đầu với một mẫu từ chối lấy mẫu tinh chỉnh (RFT) Bắt đầu lạnh”để xây dựng các kỹ năng nền tảng. Điều này được theo sau bởi học tập củng cố bằng thuật toán tùy chỉnh, sao chép tối ưu hóa chính sách lấy mẫu (DUPO), để tinh chỉnh các chiến lược khám phá của tác nhân một cách hiệu quả. Theo điểm chuẩn được công bố, phiên bản 72B của mô hình đạt được điểm số cao nhất trong các bài kiểm tra Browsecomp khó khăn bằng cả tiếng Anh và tiếng Trung. Trong bài kiểm tra tiếng Anh, nó ghi được 12.0. Các nhà nghiên cứu khẳng định rằng người quản lý mạng của mạng vượt trội so với tất cả các tác nhân nguồn mở trong các nhiệm vụ tìm kiếm thông tin phức tạp, phù hợp với các tác nhân độc quyền Hiệu suất và thu hẹp khoảng cách khả năng.”Bài viết nhấn mạnh rằng mô hình WebLailor-7B khiêm tốn hơn các tác nhân được xây dựng trên các mô hình 32B lớn hơn nhiều, nhấn mạnh hiệu quả của mô hình mới.

Tác nhân cũng cho thấy khả năng tương thích giảm mạnh. Mặc dù được đào tạo về các vấn đề cực kỳ khó khăn, WebAilor vẫn vượt qua các phương pháp khác trên điểm chuẩn đơn giản hơn, dựa trên thực tế, chứng minh rằng các kỹ năng lý luận nâng cao của nó là linh hoạt và không thỏa hiệp hiệu suất trên các nhiệm vụ cơ bản. Nó hạ cánh giữa một cuộc chiến tranh khốc liệt của một trăm mô hình”ở Trung Quốc, nơi những người khổng lồ công nghệ đang tích cực nguồn cung cấp công việc của họ để chiếm thị phần. Động thái này một cách chiến lược, Alibaba với tư cách là một nhà lãnh đạo trong phát triển AI tiên tiến, mở ra. Phòng thí nghiệm của Huawei, đã ban hành một sự từ chối của công ty, nêu rõ mô hình của nó là không phải là dựa trên đào tạo gia tăng các nhà sản xuất khác, các mô hình,”và phát triển độc lập. Sự thúc đẩy này được thúc đẩy bởi áp lực địa chính trị rộng lớn hơn, vì các lệnh trừng phạt của Hoa Kỳ hạn chế quyền truy cập vào phần cứng hàng đầu và buộc các công ty Trung Quốc xây dựng hệ sinh thái tự lực.

Những áp lực này vượt ra ngoài phần cứng. Quan hệ đối tác lớn phải đối mặt với sự giám sát quốc tế, như đã thấy khi AI tiềm năng của Apple đối phó với Alibaba đã thu hút phản ứng dữ dội ở Washington về những lo ngại về an ninh quốc gia. Điều này buộc các đại gia công nghệ Trung Quốc phải điều hướng một cảnh quan phức tạp của cạnh tranh trong nước và chính trị toàn cầu.