Google znacznie rozszerza dostęp do swojego modelu sztucznej inteligencji na urządzeniu Gemini Nano, udostępniając go twórcom aplikacji na Androida z zewnątrz za pośrednictwem nowego zestawu ML Kit Genai API. Ten rozwój, szczegółowo opisany w niedawno opublikowanym aicore , system systemu Androida, który ułatwia wykonywanie funduszy założycielskich modeli AI. Według Google ta architektura ta nie tylko zwiększa funkcjonalność aplikacji, ale także wzmacnia prywatność użytkowników, utrzymując lokalne przetwarzanie danych. Jest to znaczący krok w porównaniu z wcześniejszymi, bardziej ograniczonymi eksperymentalne ai krawędź sdk , co przede wszystkim oferowało tekst-bilety gemini nano. Przybycie do aplikacji na Androida
ML Kit Genai API, obecnie w fazie beta, umożliwi programistom zintegrowanie kilku kluczowych funkcji opartych na AI. Aplikacje będą mogły podsumować artykuły lub rozmowy na czacie na zwięzłe listy, funkcję początkowo wspierającą angielski, japoński i koreański. Funkcja korektora ma na celu udoskonalenie krótkiej treści poprzez ulepszenie gramatyki i korygowanie błędów pisowni w siedmiu językach, w tym angielskim, niemieckim i hiszpańskim.
furthermre, a „rewrite”. Pozwól aplikacjom na przesyłanie krótkich wiadomości w różnych tonach lub stylach, takich jak „skomplikowane”, „emojżowanie” lub „profesjonalne”, dostępne w tych samych siedmiu językach, co narzędzie korekty. API wprowadzają również obsługę wprowadzania obrazu, umożliwiając funkcję opisu obrazu, która może generować krótkie opisy tekstu wizualnych, początkowo w języku angielskim. To rozszerzenie AI na urządzeniu zawiera pozycje Google konkurencyjnie z ofertami takimi jak Apple Intelligence i Samsung’s Galaxy AI.
Rozważania programistów i architektura na urządzeniu
Programiści wykorzystujący te nowe narzędzia powinny być świadomi statusu beta. Dokumentacja Google wyraźnie stwierdza, że interfejs API „nie podlega polityce SLA ani zasad amortyzacji” i że „można wprowadzić zmiany w tym interfejsie API, które przerywają kompatybilność wsteczną”. Podstawowa usługa systemu AICORE zarządza dystrybucją i wykonywaniem modeli Genai, takich jak Gemini Nano, umożliwiając wielu aplikacjom na udostępnienie pojedynczej instancji modelu.
To lokalne podejście do przetwarzania oferuje korzyści, takie jak funkcjonalność offline i brak kosztów serwera dla programistów. Według dokumentacja programistów Androida , „Gemini nano umożliwia dostarczanie bogatego generatywnego doświadczeń AI bez konieczności połączenia sieciowego lub wysyłania danych do chmury. są Twoimi głównymi obawami. “
AICORE wymusza również kwot wnioskowania na aplikację, a przekroczenie tego może powodować odpowiedź na błąd. Znaczącym aktualnym ograniczeniem jest to, że wnioskowanie Genai API jest dozwolone tylko wtedy, gdy aplikacja jest aktywnym zastosowaniem pierwszego planu; Zastosowanie tła nie jest obsługiwane. Początkowa kompatybilność urządzenia, choć planowana do ekspansji, koncentruje się obecnie na wysokiej klasy smartfonach. Lista obejmuje Google’s Pixel 9 Series, Samsung Galaxy S25 Line, 15 modeli Xiaomi i inne flagowe urządzenia od producentów, takich jak Honor, Motorola i OnePlus, podkreślając znaczną wymaganą moc obliczeniową.
Ewolucja BleMini Nano On-Divice
FORUTER FOLLOUT FORUTER PROVEGWINGERS Opiera się na wcześniejszych wysiłkach Google o zintegrowaniu Gemini Nano z własnym ekosystemem. Na przykład w maju 2024 r. Google ogłosił integrację swojego kompaktowego modelu AI z klientem Chrome Desktop, w celu zasilania funkcji, takich jak „Pomóż mi pisać” w gmailu i ulepszanie
Rodzina modeli Gemini-Nano, Pro i Ultra-została po raz pierwszy wprowadzona przez Google w grudniu 2023 r. Gemini Nano został specjalnie zaprojektowany w celu skutecznego operacji na dewice, z Wczesny post na blogu Google z maja 2024 r. Zauważając, że Gemini Nano z multimodalność umożliwiłoby Pixel Devices przetwarzanie tekstu, celowników, dźwięków i mówienia bezpośrednio na urządzeniu.