Google wepchnął wczoraj swój model AI Gemini 2.5 Flash AI, dzięki czemu jest dostępny za pośrednictwem wielu kanałów: aplikacja Gemini-Devemoter i platformy programistów, w tym API Gemini za pośrednictwem Google AI Studio i Ogłoszenie Google Jako jego pierwszy „w pełni hybrydowy model rozumowania”, „2,5 Flash, oferuje programistom proste sterowanie nad kontrolą AI„ Myślenie AI “, celującego, aby zapewnić elastyczną wydajność narzędzia, i wyróżnia się na wysokim wyrażeniu, a HING-VOLUSE oferuje wysokie kompleksowe kontrole. zadania. Google pozycjonuje swój współczynnik wydajności do kosztów jako umieszczenie go na „Pareto Frontier”, sugerując optymalny saldo dla niektórych obciążeń.

Dla użytkowników końcowych modelu pojawia się w

Ta iteracja 2.5 jest opisana jako oferuje znacznie lepszą zdolność rozumowania w porównaniu do generacji błyskowej 2.0, a jednocześnie zaprojektowana jako szybsza i tańsza niż wysokiej klasy Gemini 2.5 Pro ogłoszone w marcu. Wersja aplikacji konsumenckiej obsługuje obecnie funkcje takie jak Canvas Google do udoskonalania kodu i tekstu, chociaż Google wskazuje, że głębokie wsparcie badawcze nastąpi później.

Źródło: Google

Dźwignia programistów dla AI rozumowania i kosztów

Funkcja definiowania Gemini 2.5 Flash jest jego systemem hybrydowym rozumowania, kontrolującą za pośrednictwem gemini api . Deweloperzy mogą całkowicie wyłączyć proces „myślenia”, aby uzyskać maksymalną prędkość lub umożliwić go do złożonych zapytań. Dalsza ziarnistość odbywa się za pośrednictwem regulowanej „Budżety myślenia” Zasadniczo czapka na komputerowych tokenach używanych do rozumowania na zapytanie.

mechanizm cele, aby twórcy optymalizacji w potrzebach, z niskich opowiadań, niski, opowiadanie, nie są optymaliczne, optymalio, nie optymalizacji. do zadań analitycznych. Ten poziom kontroli pozwala na precyzyjne zarządzanie kompromisem między jakością odpowiedzi, opóźnieniem i kosztami operacyjnymi.

Ta zdolność adaptacyjna znajduje odzwierciedlenie w podglądu wycena API : 0,15 USD za milion tokena zapłaty. Produkcja kosztuje 0,60 USD za milion tokenów z niepełnosprawnym myśleniem, wzrastając do 3,50 USD za milion tokenów, gdy aktywne jest rozumowanie. Google pozycjonuje tę nieuzasadnioną strukturę kosztów konkurencyjnie w stosunku do modeli takich jak O4-Mini Openai, chociaż O4-Mini pokazuje najwyższe wskaźniki wydajności w wyższej cenie.

Struktura cenowa wzmacnia przydatność Flasha do wysokiej objętości, wrażliwych na koszty zastosowania, takie jak podsumowanie, aplikacje czatu, aplikacje do czatu, napisy i wydobycie danych, przykłady podświetlone przez Blog programistów Google .

Źródło: Google

Pozycjonowanie Flash w rodzinie Gemini i jej ewolucji

BLASS GEMINI 2.5 po raz pierwszy omówiono publicznie 9 kwietnia, wprowadzone jako model odmienny od złożonych możliwości rozumowania 2,5 Pro. Pomimo koncentracji Flasha na prędkości, zachowuje on duży 1 milion tokenów charakterystyczny dla linii Pro, umożliwiając mu obsługę rozległych danych wejściowych.

podstawowa koncepcja „myślenia” ewoluowała od eksperymentalnego modelu myślenia Experimental Gemini 2.0. Ta wcześniejsza iteracja miała na celu zapewnienie przejrzystości rozumowania, częściowo jako odpowiedź na modele O1 Openai. Jeśli chodzi o ten eksperyment, Jeff Dean, główny naukowiec Google Deepmind, stwierdził na X: „Zbudowany na prędkości i wydajności 2.0 Flash, ten model jest szkolony do używania myśli w celu wzmocnienia jego rozumowania. I widzimy obiecujące wyniki, gdy zwiększamy przyjmowanie czasu wnioskowania.”

Chcesz zobaczyć, jak BleMini 2.0 Flash Think in Action? Sprawdź to demo, w którym model rozwiązuje problem fizyki i wyjaśnia jego rozumowanie. pic.twitter.com/nl0hyj7zfs

-Jeff Dean (@jeffdean) 19 grudnia 2024

podczas gdy interfejs wyraźny pokazujący „myślenia” nie jest częścią 2,5 flash, a także rozumu kontrolnego, przez kontrolny rozum, rozumu kontrolnego przez The the the the The the the the the the the the the the the the the the the the the the the the the the the the the the crut via vo Reprezentuje funkcjonalną ewolucję tego pomysłu.

Część szerszego rozszerzenia Gemini wśród analizy

Wdrożenie 2,5 Flash pasuje do szerszej ingracacji Google, w rozmieszczeniu AI w swoich usługach, łącząc ostatnie dodatki, takie jak Veo 2 Video Generation w Gemini i liczne zaawansowane i liczne Integracje Gemini.

Google ma na celu wykorzystanie tej fazy podglądu do udoskonalenia „dynamicznego myślenia” modelu opartego na informacjach zwrotnych programistów, szczególnie w odniesieniu do przypadków „gdzie jest nie do myślenia lub przesadnie”, jak wspomniał Doshi. Rozróżnienie pozostaje, że programiści otrzymują ziarniste sterowanie API, podczas gdy obecna aplikacja konsumencka oferuje Flash jako pojedynczy wybór eksperymentalny, prawdopodobnie przy domyślnie włączonym rozumowaniu.

, jak zauważono, gdy po raz pierwszy ogłoszono 2,5 Flash, ten publiczny podgląd pojawia się bez towarzyszących szczegółowych raportów technicznych lub bezpieczeństwa. Ten brak przejrzystości kontynuuje wzorzec widoczny w przypadku niektórych ostatnich wydań AI, przyciągając kontrolę, szczególnie w przypadku powszechnie dostępnych modeli. Podczas gdy Google planuje przyszłe osiągnięcia, takie jak dostępność lokalizacji i wykorzystanie nowego TPU, bezpośredni krok polega na zebraniu danych rzeczywistych, aby poprowadzić 2.5 Flash w kierunku potencjalnej wersji ogólnej.

Categories: IT Info