Google uwalnia SDK dla nowego samodzielnego modelu AI robotyki

Google DeepMind zaprezentował nowy model AI, który pozwala robotom działać z pełną autonomią, nieokreśloną z chmury. Nowy system, o nazwie Gemini Robotics Onvice, działa w całości na lokalnym sprzęcie robota, krytycznym rozwoju, który obiecuje, że systemy robotyczne są szybsze, bardziej niezawodne i zdolne do funkcjonowania w środowiskach z przerywaną lub bez łączności internetowej. Oznacza to znaczący krok w kierunku uczynienia robotów o ogólnej sytuacji w zakresie zastosowań w świecie rzeczywistym.

Google DeepMind wyjaśnia, że nowy model, zaprojektowany dla robotów dwustronnych, jest nie tylko wydajny, ale także wysoce przystosowalny i zaprojektowany w celu wymagania minimalnych zasobów obliczeniowych. Jest to pierwszy z modeli firmy w języku wizji (VLA), które zostały udostępnione do dopracowania, umożliwiając programistom dostosowanie go do nowych, wysoce zręcznych zadań z zaledwie 50 do 100 demonstracji. Ta zdolność do uogólnienia od niewielkiej liczby nowych danych może radykalnie przyspieszyć wdrażanie robotów w złożonych ustawieniach.

Aby to ułatwić, firma wypuszcza gemini robots sdk , dostępny On github, dostępny On github Selektywne program Trusted Tester , który twórcy mogą zastosować za pośrednictwem Google. To kontrolowane wdrożenie podkreśla strategiczne znaczenie modelu jako wyścig do budowy bardziej zdolnych systemów AI, intensyfikuje się wśród głównych laboratoriów technologicznych.

Race to Cord: On-evices Vs. Ai

Google

Głównym kompromisem dla sztucznej inteligencji jest jednak nieodłącznym ograniczeniem lokalnego sprzętu, który ma mniejszą moc obliczeniową i przechowywanie niż rozległe serwery w chmurze. To wyzwanie doprowadziło do różnych strategicznych zakładów w całej branży. Na przykład Figura AI wprowadziła swój model zoptymalizowany robotyki Helix AI w lutym, który, podobnie jak nowy system Google, działa całkowicie na osadzonym GPU.

Natomiast model Magma AI Magma Magma Magma Magma MAGMA jest zaprojektowany w celu głębokiej integracji z platformą Azure Cloud Platform. Strategia Google ewoluowała; Jego flagowa platforma Robotics, wprowadzona w marcu, wykorzystuje podejście hybrydowe. Nowy model na urządzeniu zapewnia dedykowane rozwiązanie dla scenariuszy, w których autonomia jest najważniejsza.

zatłoczone pole inteligencji fizycznej

Inwestycja kapitału przedsięwzięcia w przemysłową humanoidalną robotykę potroiły się w 2024 r. Do 1,2 miliarda dolarów , sygnalizując intensywną konkurencję. Według międzynarodowej federacji robotyki globalny rynek instalacji robotów przemysłowych z nich osiągnął już najwyższy poziom 16,5 miliona dolarów, z klawiszy „Fizyczna AI”-Studs, która uczę się, która uczę się, która uczę się, która uczę się, która uczy się z przemysłowego robota. Doświadczenie zamiast sztywnego programowania.

Ten konkurencyjny krajobraz obejmuje głównych graczy realizujących wyjątkowe filozofie. Podczas gdy Google i Figure AI Champion Prędkość na urządzeniu, Meta niedawno wydała V-Jepa 2, „model świata” na otwartym poziomie, który uczy się fizycznego zdrowego rozsądku z wideo. Modele te pozwalają sztucznej inteligencji uruchamiać wewnętrzne symulacje „myślenia” przed jego działaniem, pozwalając maszynom „zaplanować ruchy i interakcje w symulowanych przestrzeniach” przed próbą ich w świecie fizycznym.

To podejście dramatycznie zmniejsza kosztowne próby i błędy i przyspiesza uczenie się w zakresie zgromadzenia przemysłowego i logistyki. Ta metoda, skupiona na budowaniu wewnętrznego zrozumienia fizyki, oferuje kolejną ścieżkę do tworzenia robotów, które mogą poruszać się w nieprzewidywalnych środowiskach ludzkich.

Nauczanie robotów uczenia się jak ludzie

w sercu nowego modelu Google koncentruje się na generalizacji-zdolność do wykonywania nowych zadań z minimalnym treningiem. Osiąga się to dzięki technice znanej jako niewielka nauka (FSL), która pozwala modelowi uczyć się z bardzo niewielkiej liczby przykładów. Takie podejście ma na celu naśladuj ludzkie zdolności Aby szybko uchwycić nowe koncepcje, co jest wyraźnym kontrastem z tradycyjnymi modelami AI, które często wymagają milionów punktów danych. W przypadku robotyki, gdzie zbieranie rozległych, oznaczonych zestawów danych dla każdego możliwego zadania jest niepraktyczne, FSL jest zmieniającym grę.

Google twierdzi, że na urządzenie na urządzenie Gemini można dostosować z zaledwie 50 do 100 demonstracji. Firma dostarczyła konkretnych dowodów na tę zdolność adaptacyjną, zauważając, że chociaż model został początkowo przeszkolony dla robotów Aloha, z powodzeniem dostosowano do robota FR3 Franka FR3 i robota humanoidalnego Apollo przez Apptronika.

Ta zdolność umożliwia szerszy potencjał systemu. Jako Carolina Parada, szef robotyki w Google DeepMind, wyjaśniono w Zgłaszanie z ARS technik , Modna Model rozciąga się poza proste polecenia. „Wyciąga z multimodalnego zrozumienia świata Gemini, aby wykonać zupełnie nowe zadanie… co umożliwia to w ten sam sposób, w jaki Gemini może tworzyć tekst, pisać poezję, wystarczy podsumować artykuł, możesz również napisać kod, a także generować obrazy. Może także generować działania robotów.„

Od otwartej nauki po zasady Guarded

może również generować działania robotów. SDK za pośrednictwem ograniczonego programu podkreśla szersze strategiczne oskarżenie w DeepMind. Laboratorium, niegdyś bastion otwartej publikacji naukowej, teraz bardziej selektywnie uwalnia swoją podstawową technologię w celu ochrony przewagi konkurencyjnej Google. Ta zmiana podobno spowodowała tarcie wewnętrznie, z jednym badaczem
Ta zastrzeżona postawa kontrastuje ostro z rolą Meta w sztucznej inteligencji z open source z jej modelami LLAMA, strategią mającą na celu przyspieszenie innowacji społeczności. Podczas gdy ta otwartość jest chwalona, wydajność otwartych modeli historycznie podążała za ich zamkniętymi odpowiednikami. Najlepsze modele open source pozostały w tyle za zastrzeżonymi o kilka miesięcy, choć ta luka się kurczy. Ta różnica wydajności pomaga wyjaśnić, dlaczego firma taka jak Google strzeżeła swojej najbardziej zaawansowanej technologii, nawet jeśli zapewnia programistom narzędzia do budowania na niej.

Wydanie Google na urządzeniu na urządzeniu jest obliczonym ruchem w konkurencji o wysokich stawkach w celu zbudowania nowej generacji inteligentnych maszyn. Zajmuje się bezpośrednio krytyczną potrzebą branży w systemach autonomicznych o niskim opóźnieniu, jednocześnie prezentując niezwykłe postępy w szybkim, podobnym do człowieka uczenia się. Jednak ostateczny wpływ modelu zostanie ukształtowany nie tylko przez jego sprawność techniczną, ale także strategiczne napięcie między duchem wspólnych badań otwartych a strzeżoną rzeczywistością konkurencji komercyjnej.

Google uwalnia SDK dla nowego samodzielnego modelu AI robotyki

Published by All Things Windows on June 24, 2025

Race to Cord: On-evices Vs. Ai

zatłoczone pole inteligencji fizycznej

Nauczanie robotów uczenia się jak ludzie

Od otwartej nauki po zasady Guarded

IT Info

Elon Musk’s X pozuje Nowy Jork, eskaluje wojnę w wolności słowa nad prawem mowy nienawiści

IT Info

Google i Lenovo uruchamiają Chromebook z AI Plus 14

IT Info

Jak odrzucenie przejęcia przez Runway AI wysłało Meta na wielomiliardowy szaleństwo do zatrudnienia

Google uwalnia SDK dla nowego samodzielnego modelu AI robotyki

Published by All Things Windows on June 24, 2025

Race to Cord: On-evices Vs. Ai

zatłoczone pole inteligencji fizycznej

Nauczanie robotów uczenia się jak ludzie

Od otwartej nauki po zasady Guarded

Related Posts

IT Info

Elon Musk’s X pozuje Nowy Jork, eskaluje wojnę w wolności słowa nad prawem mowy nienawiści

IT Info

Google i Lenovo uruchamiają Chromebook z AI Plus 14

IT Info

Jak odrzucenie przejęcia przez Runway AI wysłało Meta na wielomiliardowy szaleństwo do zatrudnienia