Google DeepMind zaprezentował nowy model AI, który pozwala robotom działać z pełną autonomią, nieokreśloną z chmury. Nowy system, o nazwie Gemini Robotics Onvice, działa w całości na lokalnym sprzęcie robota, krytycznym rozwoju, który obiecuje, że systemy robotyczne są szybsze, bardziej niezawodne i zdolne do funkcjonowania w środowiskach z przerywaną lub bez łączności internetowej. Oznacza to znaczący krok w kierunku uczynienia robotów o ogólnej sytuacji w zakresie zastosowań w świecie rzeczywistym.
Google DeepMind wyjaśnia, że nowy model, zaprojektowany dla robotów dwustronnych, jest nie tylko wydajny, ale także wysoce przystosowalny i zaprojektowany w celu wymagania minimalnych zasobów obliczeniowych. Jest to pierwszy z modeli firmy w języku wizji (VLA), które zostały udostępnione do dopracowania, umożliwiając programistom dostosowanie go do nowych, wysoce zręcznych zadań z zaledwie 50 do 100 demonstracji. Ta zdolność do uogólnienia od niewielkiej liczby nowych danych może radykalnie przyspieszyć wdrażanie robotów w złożonych ustawieniach.
Aby to ułatwić, firma wypuszcza gemini robots sdk , dostępny On github, dostępny On github Selektywne program Trusted Tester , który twórcy mogą zastosować za pośrednictwem Google. To kontrolowane wdrożenie podkreśla strategiczne znaczenie modelu jako wyścig do budowy bardziej zdolnych systemów AI, intensyfikuje się wśród głównych laboratoriów technologicznych.
Race to Cord: On-evices Vs. Ai
Google
Głównym kompromisem dla sztucznej inteligencji jest jednak nieodłącznym ograniczeniem lokalnego sprzętu, który ma mniejszą moc obliczeniową i przechowywanie niż rozległe serwery w chmurze. To wyzwanie doprowadziło do różnych strategicznych zakładów w całej branży. Na przykład Figura AI wprowadziła swój model zoptymalizowany robotyki Helix AI w lutym, który, podobnie jak nowy system Google, działa całkowicie na osadzonym GPU. Natomiast model Magma AI Magma Magma Magma Magma MAGMA jest zaprojektowany w celu głębokiej integracji z platformą Azure Cloud Platform. Strategia Google ewoluowała; Jego flagowa platforma Robotics, wprowadzona w marcu, wykorzystuje podejście hybrydowe. Nowy model na urządzeniu zapewnia dedykowane rozwiązanie dla scenariuszy, w których autonomia jest najważniejsza. Inwestycja kapitału przedsięwzięcia w przemysłową humanoidalną robotykę potroiły się w 2024 r. Do 1,2 miliarda dolarów , sygnalizując intensywną konkurencję. Według międzynarodowej federacji robotyki globalny rynek instalacji robotów przemysłowych z nich osiągnął już najwyższy poziom 16,5 miliona dolarów, z klawiszy „Fizyczna AI”-Studs, która uczę się, która uczę się, która uczę się, która uczę się, która uczy się z przemysłowego robota. Doświadczenie zamiast sztywnego programowania. Ten konkurencyjny krajobraz obejmuje głównych graczy realizujących wyjątkowe filozofie. Podczas gdy Google i Figure AI Champion Prędkość na urządzeniu, Meta niedawno wydała V-Jepa 2, „model świata” na otwartym poziomie, który uczy się fizycznego zdrowego rozsądku z wideo. Modele te pozwalają sztucznej inteligencji uruchamiać wewnętrzne symulacje „myślenia” przed jego działaniem, pozwalając maszynom „zaplanować ruchy i interakcje w symulowanych przestrzeniach” przed próbą ich w świecie fizycznym. To podejście dramatycznie zmniejsza kosztowne próby i błędy i przyspiesza uczenie się w zakresie zgromadzenia przemysłowego i logistyki. Ta metoda, skupiona na budowaniu wewnętrznego zrozumienia fizyki, oferuje kolejną ścieżkę do tworzenia robotów, które mogą poruszać się w nieprzewidywalnych środowiskach ludzkich. w sercu nowego modelu Google koncentruje się na generalizacji-zdolność do wykonywania nowych zadań z minimalnym treningiem. Osiąga się to dzięki technice znanej jako niewielka nauka (FSL), która pozwala modelowi uczyć się z bardzo niewielkiej liczby przykładów. Takie podejście ma na celu naśladuj ludzkie zdolności Aby szybko uchwycić nowe koncepcje, co jest wyraźnym kontrastem z tradycyjnymi modelami AI, które często wymagają milionów punktów danych. W przypadku robotyki, gdzie zbieranie rozległych, oznaczonych zestawów danych dla każdego możliwego zadania jest niepraktyczne, FSL jest zmieniającym grę. Google twierdzi, że na urządzenie na urządzenie Gemini można dostosować z zaledwie 50 do 100 demonstracji. Firma dostarczyła konkretnych dowodów na tę zdolność adaptacyjną, zauważając, że chociaż model został początkowo przeszkolony dla robotów Aloha, z powodzeniem dostosowano do robota FR3 Franka FR3 i robota humanoidalnego Apollo przez Apptronika. Ta zdolność umożliwia szerszy potencjał systemu. Jako Carolina Parada, szef robotyki w Google DeepMind, wyjaśniono w Zgłaszanie z ARS technik , Modna Model rozciąga się poza proste polecenia. „Wyciąga z multimodalnego zrozumienia świata Gemini, aby wykonać zupełnie nowe zadanie… co umożliwia to w ten sam sposób, w jaki Gemini może tworzyć tekst, pisać poezję, wystarczy podsumować artykuł, możesz również napisać kod, a także generować obrazy. Może także generować działania robotów.„ Ta zastrzeżona postawa kontrastuje ostro z rolą Meta w sztucznej inteligencji z open source z jej modelami LLAMA, strategią mającą na celu przyspieszenie innowacji społeczności. Podczas gdy ta otwartość jest chwalona, wydajność otwartych modeli historycznie podążała za ich zamkniętymi odpowiednikami. Najlepsze modele open source pozostały w tyle za zastrzeżonymi o kilka miesięcy, choć ta luka się kurczy. Ta różnica wydajności pomaga wyjaśnić, dlaczego firma taka jak Google strzeżeła swojej najbardziej zaawansowanej technologii, nawet jeśli zapewnia programistom narzędzia do budowania na niej. Wydanie Google na urządzeniu na urządzeniu jest obliczonym ruchem w konkurencji o wysokich stawkach w celu zbudowania nowej generacji inteligentnych maszyn. Zajmuje się bezpośrednio krytyczną potrzebą branży w systemach autonomicznych o niskim opóźnieniu, jednocześnie prezentując niezwykłe postępy w szybkim, podobnym do człowieka uczenia się. Jednak ostateczny wpływ modelu zostanie ukształtowany nie tylko przez jego sprawność techniczną, ale także strategiczne napięcie między duchem wspólnych badań otwartych a strzeżoną rzeczywistością konkurencji komercyjnej. zatłoczone pole inteligencji fizycznej
Nauczanie robotów uczenia się jak ludzie
Od otwartej nauki po zasady Guarded