Google DeepMind đã tiết lộ SIMA 2 vào thứ Năm, một tác nhân AI mới sử dụng mô hình Gemini để tìm hiểu và hành động trong trò chơi điện tử 3D. Không giống như phiên bản tiền nhiệm, SIMA 2 có thể nghĩ về các mục tiêu cấp cao, trò chuyện với người dùng và tự dạy mình những kỹ năng mới.
Nó đã được đào tạo trong các trò chơi phổ biến như Goat Simulator 3 và thậm chí có thể chơi ở những thế giới mà nó chưa từng thấy trước đây. Dự án của DeepMind là một bước quan trọng hướng tới mục tiêu xây dựng AI nói chung. Phòng thí nghiệm hy vọng các kỹ năng học được trong trò chơi một ngày nào đó sẽ cung cấp năng lượng cho các robot hữu ích trong thế giới thực.
Từ Người làm theo hướng dẫn đến Người đồng hành lý luận
Bằng cách nhúng mô hình Song Tử vào cốt lõi, SIMA 2 vượt xa các lệnh đơn giản. Tiền thân của nó, SIMA ban đầu được giới thiệu vào tháng 3 năm 2024, là bước quan trọng đầu tiên, học cách thực hiện hơn 600 kỹ năng tuân theo ngôn ngữ như”leo lên bậc thang”trên nhiều thế giới ảo khác nhau.
Tác nhân đó hoạt động bằng cách xem màn hình và sử dụng bàn phím và chuột ảo, giống như người chơi thực. SIMA 2 được xây dựng trên nền tảng này nhưng bổ sung thêm một lớp nhận thức quan trọng, phát triển từ một công cụ thành một đối tác tương tác.
Giờ đây, nhân viên hỗ trợ có thể hiểu mục tiêu cấp cao của người dùng và lý do về các bước cần thiết để đạt được mục tiêu đó.
Điều này chuyển đổi sự tương tác từ ra lệnh sang cộng tác với một người bạn đồng hành.
“Trò chơi đã là động lực thúc đẩy hoạt động nghiên cứu của nhân viên trong một thời gian dài”, Joe Marino, Nhà khoa học nghiên cứu tại Google DeepMind, trong thời gian qua một cuộc họp báo.
Sự tích hợp của Gemini cho phép SIMA 2 mô tả ý định và giải thích hành động của nó, giúp quá trình này trở nên minh bạch và mang tính tương tác hơn đối với người dùng.
[nội dung nhúng]
Việc đào tạo bao gồm sự kết hợp giữa video minh họa của con người và nhãn do Gemini tạo. DeepMind hợp tác với nhiều nhà phát triển trò chơi, bao gồm Coffee Stain (Valheim, Satisfactory, Goat Simulator 3), Hello Games (No Man’s Sky) và Tuxedo Labs (Teardown), để xây dựng chương trình đào tạo đa dạng mặt đất.
Việc tiếp xúc với nhiều thể loại và cơ chế trò chơi khác nhau là chìa khóa để phát triển một tác nhân tổng quát không bị ràng buộc bởi các quy tắc của một môi trường duy nhất.
Một chu kỳ đạo đức: Tự cải thiện trong các thế giới được tạo ra
Một trong những tiến bộ quan trọng nhất của SIMA 2 là khả năng tự cải thiện. Sau giai đoạn đầu học hỏi từ các cuộc biểu diễn của con người, đặc vụ có thể bước vào vòng lặp tự cải thiện.
Nó thực hành trong các trò chơi mới thông qua cách chơi tự định hướng, sử dụng phương pháp thử và sai và nhận phản hồi từ mô hình Gemini để tinh chỉnh các kỹ năng của mình.
Quy trình này cho phép đặc vụ thực hiện các nhiệm vụ mới mà không cần thêm dữ liệu do con người tạo ra, một cột mốc quan trọng đối với khả năng học tập có thể mở rộng.
Để nâng cao giới hạn của khả năng này, DeepMind đã kết hợp SIMA 2 với một trong những tham vọng khác của nó. dự án: Genie 3.
Genie 3 là mô hình thế giới có thể tạo ra môi trường 3D mới, có thể chơi được từ một dấu nhắc văn bản đơn giản. Kiến trúc của nó được thiết kế để đảm bảo tính nhất quán và như Giám đốc Nghiên cứu Shlomi Fruchter giải thích,”tự động hồi quy, nghĩa là nó tạo ra một khung hình tại một thời điểm. Nó phải nhìn lại những gì đã được tạo trước đó để quyết định điều gì sẽ xảy ra tiếp theo.”
Việc tạo tuần tự là rất quan trọng để tạo ra thế giới ổn định nơi tác nhân có thể học hỏi.
Khi SIMA 2 được đặt trong những thế giới hoàn toàn mới lạ do AI tạo ra này, nó đã thể hiện khả năng thích ứng, tự định hướng và tự định hướng đáng chú ý. thực hiện các hướng dẫn của người dùng.
Sức mạnh tổng hợp này tạo ra một võ đường huấn luyện mạnh mẽ. Genie 3 có thể tạo ra vô số tình huống, cung cấp chương trình giảng dạy vô tận để SIMA 2 học hỏi.
Chiến lược xây dựng AI mạnh mẽ và dễ thích ứng hơn của DeepMind dựa trên cách tiếp cận này.
“Chúng tôi cho rằng các mô hình thế giới là chìa khóa trên con đường hướng tới AGI, đặc biệt dành cho các tác nhân được thể hiện, trong đó việc mô phỏng các tình huống trong thế giới thực là đặc biệt khó khăn”, Jack Parker-Holder, Nhà khoa học nghiên cứu trong nhóm giải thích.
Mô phỏng vô số vô số kịch bản trong thế giới thực. các tình huống là cách an toàn hơn, hiệu quả hơn để dạy AI về sự phức tạp trong tương tác.
Vượt ra ngoài trò chơi: Con đường dẫn đến AGI hiện thân và những rào cản của nó
Mặc dù bối cảnh trước mắt là trò chơi điện tử, nhưng tham vọng cuối cùng của DeepMind lại nằm ở thế giới vật chất. Các kỹ năng mà SIMA 2 đang học – điều hướng, sử dụng công cụ, lập kế hoạch và cộng tác – là những nền tảng cơ bản cho trí thông minh hiện thân.
Công ty coi nghiên cứu này là con đường trực tiếp hướng tới việc tạo ra các trợ lý AI và robot có năng lực, có thể hoạt động an toàn và hiệu quả trong môi trường con người.
“SIMA 2 xác nhận rằng AI được đào tạo để có năng lực rộng… có thể hợp nhất thành công khả năng của nhiều hệ thống chuyên biệt thành một tác nhân tổng quát, mạch lạc”, Nhóm SIMA tuyên bố trong thông báo của họ, đồng thời coi dự án là một sự hợp nhất của các hệ thống chuyên biệt thành một tác nhân duy nhất, mạch lạc.
Tuy nhiên, con đường từ thế giới ảo đến thực tế còn nhiều thách thức. Các chuyên gia trong lĩnh vực này, mặc dù thừa nhận thành tựu kỹ thuật, nhưng khuyến cáo nên thận trọng về khả năng ứng dụng trực tiếp của những kỹ năng này.
Julian Togelius, một nhà nghiên cứu AI tại Đại học New York, nhấn mạnh sự khó khăn của phương pháp này, lưu ý rằng “chỉ chơi trong thời gian thực từ đầu vào trực quan là’chế độ cứng’.”Tác nhân phải diễn giải các pixel thô mà không có bất kỳ dữ liệu trò chơi cơ bản nào, một nhiệm vụ đòi hỏi nhiều tính toán và dễ xảy ra lỗi.
Hơn nữa, có những câu hỏi về việc những hành vi đã học này sẽ chuyển sang chế tạo robot hiệu quả như thế nào.