Google DeepMind推出了一種新的AI模型,該模型允許機器人以完全自主權操作,並且不受雲的束縛。新系統名為Gemini Robotics On Device,完全在機器人的本地硬件上運行,這是一種關鍵開發,有望使機器人系統更快,更可靠,並且能夠在間歇性或沒有Internet連接性的環境中運行。這標誌著使通用機器人用於現實世界應用程序的重要一步。

Google DeepMind解釋說,為雙臂機器人設計的新模型不僅有效,而且還具有高度適應性和高度適應性,並且設計為需要最小的計算資源。它是公司的願景語言行動(VLA)模型中的第一個用於微調的模型,使開發人員可以將其調整為新的,非常靈巧的任務,其中只有50至100個演示。從少量新數據中概括的這種能力可以極大地加速機器人在復雜的設置中的部署。

,為了促進這一點,公司正在發布 ai

Google的

,對設備AI的主要權衡取捨是本地硬件的固有限制,與廣泛的雲服務器相比,其計算能力和存儲較少。這一挑戰導致了整個行業的不同戰略賭注。例如,圖AI在2月推出了其機器人技術優化的Helix AI模型,與Google的新系統一樣,它完全在嵌入式GPU上運行。

相比之下,Microsoft的Magma AI模型旨在與Azure Cloud Platform進行深度集成,以實現Enterprise Enterprise Automation的可靠性。 Google自己的策略已經發展; 3月推出的旗艦雙子座機器人平台採用了混合方法。新的設備模型為自主權至關重要的方案提供了專門的解決方案。

一個體力智能的擁擠領域

工業類人類機器人機器人的風險投資在2024年三倍至12億美元,信號激烈的競爭。 根據機器人的國際聯盟,工業機器人安裝的全球市場已經達到了16.5億美元的全球範圍。

從經驗而不是僵化的編程中,這種競爭格局包括追求獨特哲學的主要參與者。當Google和Fige AI冠軍的智障速度時,Meta最近發布了V-JEPA 2,這是一種開源的“世界模型”,從視頻中學習了物理常識。這些模型允許AI進行內部模擬在行動之前“思考”,讓機器“計劃運動和模擬空間中的互動”在嘗試在物理世界中。

這種方法大大降低了代價高昂的試驗,並加速了工業組裝和物流的任務。這種側重於建立內部理解的方法為創建機器人提供了另一個途徑,可以導航不可預測的人類環境。

教機器人在Google新模型的核心上教機器人學習以學習的方式學習,這是對經典的重點-進行新任務進行新任務。這是通過一種稱為少量學習(FSL)的技術來實現的,該技術使模型可以從少數示例中學習。這種方法試圖模仿人類能力快速掌握新概念,與傳統的AI模型通常需要數百萬個數據點。對於機器人技術,在每個可能的任務中收集大量,標記的數據集是不切實際的,FSL是一個改變遊戲規則的人。

Google聲稱,Gemini Robotics Ondevice可以使用少於50到100個演示。該公司提供了這種適應性的具體證據,並指出,儘管該模型最初是為Aloha機器人培訓的,但它已成功地適應了Apptronik的Bi-Armarm Franka FR3機器人和Apollo人類機器人。

此功能使該系統具有更大的潛力。正如Google DeepMind的機器人技術負責人Carolina Parada在“ _ _ black”> expenters note

這種專有立場與Meta在開源AI中的作用與其Llama模型(該戰略旨在加速社區創新)形成鮮明對比。儘管這種開放性受到稱讚,但開放模型的表現歷史上一直落後於他們的封閉源。最好的開源模型落後了幾個月,儘管差距正在減少。這種績效差異有助於解釋為什麼像Google這樣的公司會捍衛其最先進的技術,即使它為開發人員提供了基於它的工具。

Google發布的Gemini Robotics On Device是在高風險競爭中的一項計算的舉動,以建立下一代智能機器。它直接解決了該行業對低延遲,自主系統的關鍵需求,同時展示了快速,類似人類的學習方面的顯著進步。然而,該模型的最終影響不僅將取決於其技術實力,而且還取決於開放研究的協作精神與商業競爭的守護現實之間的戰略張力。