Google har styrket sin kunstige intelligensstrategi, og flyttet sin kraftige Gemini 2.5 Pro og 2,5 flash-modeller til generell tilgjengelighet for produksjonsbruk, samtidig som den utvider porteføljen med en ny, kostnadseffektiv modell kalt Gemini 2.5 flash-lite. Selskapet etablerte en klar tre-lags produktfamilie, et betydelig trekk designet for å gi utviklere et forutsigbart og skreddersydd sett med alternativer som balanserer ytelse, hastighet og kostnad.

Den strategiske overhalingen gir klarhet i det som hadde vært en raskt bevegelse og noen ganger forvirrende serie med forhåndsvisningsutgivelser, og signaliserte en ny fase av stabilitet for utviklere som bygger på Googles plattform. I en Innlegg på nøkkelordet, Google’s Toping blogg , Senior Director Tulsee Doshi Frameed the Strategy Top the Goal To Create As Create en Create en Crue Tules for Hybrat som en”Pareto-grensen for kostnad og hastighet.”

Denne modningen understrekes ytterligere av en stor forenkling i prisingen for Gemini 2.5 Flash, som forlater en kompleks forhåndsvisningsstruktur for en enkelt, enhetlig hastighet.

En modell for hvert oppdrag: Pro, Flash og Flash-Lite

Googles offisielle dokumentasjon for utviklere . På toppen er Gemini 2.5 Pro plassert for ‘maksimal responsnøyaktighet og topp moderne ytelse,’ gjør det til motoren for de mest komplekse koding, analyse og agentiske oppgaver. Interne benchmarks viser at det fører til vanskelige domener som matematikk og kodedigering.

Å okkupere mellomnivået er Gemini 2.5-blits, konstruert for ‘lav latens, høye volumoppgaver som krever tenking.’ Det fungerer som en balansert all-runde, og tilbyr ytelse som ofte nærmer seg Pro, men til en betydelig lavere kostnad. Hierarkiet er imidlertid ikke alltid strengt lineært; I en bemerkelsesverdig nyanse fra Googles egen testing, overgikk Flash-modellen med tenkning som muliggjorde den kraftigere Pro-modellen på en spesifikk henting av langkontekst henting, noe som antydet spesialiserte optimaliseringer innen arkitekturen.

Det nyeste medlemmet, Gemini 2.5 Flash-Lite, er hastigheten og skala-spesialisten. Nå tilgjengelig i forhåndsvisning, beskrives det som den ‘mest kostnadseffektive modellen som støtter høy gjennomstrømning’ for sanntidsapplikasjoner som dataklassifisering og oppsummering i skala.

prising, forenklet: en klarere vei for utviklere

en kritisk. I løpet av forhåndsvisningsfasen, som startet i april, inneholdt modellen et forvirrende dobbeltprisingssystem basert på om dets resonnementfunksjon var aktiv. Google har nå eliminert den kompleksiteten, og satt en enkelt rate på $ 0,30 per Prisstrukturen blir ytterligere avklart av gemini apis’Free Tier’, som tilbyr utviklere en måte å eksperimentere med lavere rate før du vil ha den”. Kontrollerbar AI-resonnement

Sentralt i hele 2.5-familien er konseptet ‘hybrid resonnement’, et kontrollerbart trekk som lar modellene utføre dypere, flertrinns logisk verifisering før de svarer. Dette er mer enn en enkel veksling; Utviklere kan Sett et ‘tenkende budsjett’ for å kontrollere beregningsressursene en modell bruker for å resonnere på en precise-budsjett”

p> og kostnad. Funksjonen, som først ble introdusert med 2,5 flash-forhåndsvisning utvidet til Gemini 2.5 Pro i mai, er en kjernedel av familiens arkitektur. Effekten er håndgripelig: å aktivere ‘tenking’ på Gemini 2.5 Flash-Lite, for eksempel, øker poengsummen på en viktig matematikk-benchmark fra 49,8% til 63,1%, og gir utviklere en spak for å forbedre nøyaktigheten når det er nødvendig. Atmosfære rundt den første utgivelsen av Gemini 2.5-serien. I slutten av mars presset Google sin eksperimentelle 2.5 Pro-modell til alle gratis brukere bare dager etter den eksklusive lanseringen til å betale abonnenter. Selskapets sosiale mediekonto erklærte den gangen, “Teamet sprint, TPUer kjører varmt, og vi ønsker å få vår mest intelligente modell inn i flere menneskers hender ASAP.”

Den raske utplasseringen ble imidlertid møtt med kritikk fra AI-styringseksperter da den medfølgende sikkerhetsrapporten kom uker senere med noe som vurderte magere detaljer. Kevin Bankston fra Center for Democracy and Technology beskrev det den gangen som en del av en”urovekkende historie om et løp til bunns på AI-sikkerhet og åpenhet når selskaper skynder modellene sine til markedet.”

Dagens kunngjøring av”generell tilgjengelighet”signaliserer en strategisk modning. Som nevnt i Vertex AI utgivelsesnotater , innebærer denne statusen at modellene er stabil, støttet for produksjonsbruk, og kommer med tjenestetilbud. Dette skiftet fra eksperimentelle sprinter til en stabil, lagdelt og forutsigbart priset produktfamilie viser at Google bygger et mer holdbart fundament for sine brede AI-ambisjoner, som var på full visning på den nylige I/O-konferansen.

Categories: IT Info