Google ka forcuar strategjinë e saj të inteligjencës artificiale, duke lëvizur modelet e saj të fuqishme Gemini 2.5 Pro dhe 2.5 Flash në disponueshmërinë e përgjithshme për përdorim të prodhimit, ndërsa njëkohësisht zgjeron portofolin e tij me një model të ri, me kosto efektive të quajtur Gemini 2.5 Flash-Lite. Kompania themeloi një familje të qartë të produkteve me tre nivele, një veprim i rëndësishëm i krijuar për t’u dhënë zhvilluesve një grup opsionesh të parashikueshme dhe të përshtatura që ekuilibrojnë performancën, shpejtësinë dhe koston. Në një postimi në fjalen e fjalës, blogu zyrtar i Google””Pareto Frontier i kostos dhe shpejtësisë.”
Kjo pjekuri nënvizohet më tej nga një thjeshtësim i madh në çmimet për Gemini 2.5 Flash, i cili braktis një strukturë komplekse të shikimit për një normë të vetme, të unifikuar. src=”të dhëna: image/svg+xml; nitro-empty-id=mtyzodoxmjy4-1; base64, phn2zyb2awv3qm94psiwidagmti4mcaxnda4 Iib3awr0ad0imti4mcigagvpz2h0psixnda4iib4bwxucz0iahr0cdovl3d3dy53my5vcmcvmjawmc9zdmcipjwvc3znpg==”>
një model për çdo mision: pro, flash, dhe flash-lite
dokumentacioni zyrtar i Google për zhvilluesit . Në krye, Gemini 2.5 Pro pozicionohet për”saktësinë maksimale të përgjigjes dhe performancën më të lartë të artit”, duke e bërë atë motorin për kodet, analizat dhe agjentët më komplekse të kodimit. Standardet e brendshme e tregojnë atë duke udhëhequr në fusha të vështira si matematikë dhe redaktim të kodit. Hierarkia nuk është gjithmonë rreptësisht lineare, megjithatë; Në një nuancë të dukshme nga testimi i vetë Google, modeli Flash me të menduarit mundësoi që në të vërtetë tejkaloi modelin më të fuqishëm Pro në një pikë referimi specifik të kontekstit të gjatë, duke sugjeruar optimizime të specializuara brenda arkitekturës. Tani i disponueshëm në vrojtim, ai përshkruhet si”modeli më me kosto efikase që mbështet rrjedhje të lartë”për aplikime në kohë reale si klasifikimi i të dhënave dhe përmbledhja në shkallë. Gjatë fazës së tij të shikimit, i cili filloi në prill, modeli paraqiti një sistem konfuz me çmime të dyfishta bazuar në faktin nëse tipari i tij i arsyetimit ishte aktiv. Google tani e ka eleminuar atë kompleksitet, duke vendosur një normë të vetme prej 0.30 $ për milion shenja hyrëse dhe 2,50 dollarë për milion shenja dalëse. Struktura e çmimeve sqarohet më tej nga Binjakët e AP-së ‘Free Tier’ , i cili u ofron zhvilluesve një mënyrë për të eksperimentuar me kufijtë e nivelit të ulët para se të angazhohen për nivelin më të lartë të volumit. Arsyetimi i AI
Qendrore për të gjithë familjen 2.5 është koncepti i”arsyetimit hibrid”, një veçori e kontrollueshme që lejon modelet të kryejnë verifikimin logjik më të thellë, me shumë hapa përpara se të përgjigjet. Kjo është më shumë se një ndërprerje e thjeshtë; Zhvilluesit mund Vendosni një”buxhet të menduar” Për të kontrolluar burimet llogaritëse që një model përdor për arsyetimin në baza per-query. Karakteristika, e prezantuar për herë të parë me 2.5 Flash Preview të shtrirë në Gemini 2.5 Pro në maj, është një pjesë thelbësore e arkitekturës së familjes. Ndikimi i tij është i prekshëm: Mundësimi i ‘të menduarit’ në Gemini 2.5 flash-lite, për shembull, rrit rezultatin e tij në një standard kryesor të matematikës nga 49.8% në 63.1%, duke i dhënë zhvilluesve një levë për të rritur saktësinë kur është e nevojshme. Atmosfera që rrethon lëshimin fillestar të serisë Gemini 2.5. Në fund të marsit, Google shtyu modelin e tij eksperimental 2.5 Pro për të gjithë përdoruesit e lirë vetëm disa ditë pas fillimit të tij ekskluziv për të paguar pajtimtarët. Llogaria e mediave sociale të kompanisë deklaroi në atë kohë,”Ekipi është duke sprinting, TPU-të po nxehen, dhe ne duam të marrim modelin tonë më inteligjent në më shumë duar të njerëzve ASAP.”Kevin Bankston i Qendrës për Demokraci dhe Teknologji e përshkroi atë në atë kohë si pjesë e një”histori shqetësuese të një gare në fund të sigurisë dhe transparencës së AI pasi kompanitë nxitojnë modelet e tyre në treg.”Siç u përmend në Vertex AI shënime të lëshimit , ky status nënkupton që modelet janë të qëndrueshme, të mbështetur për përdorim të prodhimit, dhe vijnë me marrëveshje të nivelit të shërbimit. Kjo zhvendosje nga sprints eksperimentale në një familje të qëndrueshme, me nivele dhe me çmime të parashikueshme, Google po ndërton një themel më të qëndrueshëm për ambiciet e saj të gjera të AI, të cilat ishin në ekran të plotë në konferencën e saj të fundit I/O.