Google DeepMind đã tiết lộ một mô hình AI mới cho phép robot hoạt động với sự tự chủ hoàn toàn, không bị trói buộc từ đám mây. Hệ thống mới, được đặt tên là Gemini Robotics trên thiết bị, chạy hoàn toàn trên phần cứng địa phương của robot, một sự phát triển quan trọng hứa hẹn sẽ làm cho các hệ thống robot nhanh hơn, đáng tin cậy hơn và có khả năng hoạt động trong môi trường có kết nối internet không liên tục hoặc không có. Điều này đánh dấu một bước quan trọng để làm cho các robot có mục đích chung thực tế cho các ứng dụng trong thế giới thực. Đây là mô hình đầu tiên của công ty các mô hình hành động ngôn ngữ (VLA) của công ty được cung cấp để điều chỉnh tinh chỉnh, cho phép các nhà phát triển điều chỉnh nó cho các nhiệm vụ mới, khéo léo với khoảng 50 đến 100 cuộc biểu tình. Khả năng khái quát hóa từ một lượng nhỏ dữ liệu mới có thể đẩy nhanh đáng kể việc triển khai robot trong các cài đặt phức tạp.
Google Lừa tăng gấp ba lần vào năm 2024 lên 1,2 tỷ USD , báo hiệu sự cạnh tranh khốc liệt.
Cảnh quan cạnh tranh này bao gồm những người chơi lớn theo đuổi các triết lý độc đáo. Trong khi Google và Fig AI Champion On-Device Speed, Meta gần đây đã phát hành V-Jepa 2, một mô hình thế giới nguồn mở”học tập thể chất thông thường từ video. Các mô hình này cho phép AI chạy các mô phỏng nội bộ để nghĩ rằng”trước khi nó hoạt động, hãy để máy móc lập kế hoạch chuyển động và tương tác trong không gian mô phỏng”trước khi thử chúng trong thế giới vật lý. Phương pháp này, tập trung vào việc xây dựng sự hiểu biết nội bộ về vật lý, đưa ra một con đường khác để tạo ra robot có thể điều hướng môi trường của con người không thể đoán trước. Điều này đạt được thông qua một kỹ thuật được gọi là ít học tập (FSL), cho phép một mô hình học hỏi từ một số lượng rất nhỏ các ví dụ. Cách tiếp cận này tìm cách mô phỏng khả năng của con người để nắm bắt các khái niệm mới một cách nhanh chóng, một sự tương phản rõ rệt với các mô hình AI truyền thống thường yêu cầu hàng triệu điểm dữ liệu. Đối với Robotics, nơi thu thập các bộ dữ liệu được dán nhãn lớn cho mọi nhiệm vụ có thể là không thực tế, FSL là một công cụ thay đổi trò chơi. Công ty đã cung cấp bằng chứng cụ thể về khả năng thích ứng này, lưu ý rằng trong khi mô hình ban đầu được đào tạo cho các robot aloha, nó đã được điều chỉnh thành công với robot FR3 FR3 hai cánh tay và robot hình người Apollo bởi Apptronik. Như Carolina Parada, người đứng đầu Robotics tại Google DeepMind, đã giải thích trong