Google työnsi Gemini 2.5 Flash AI-mallinsa eilen julkiseen esikatseluun, jolloin se on saatavana useiden kanavien kautta: kuluttaja-facing gemini-sovellus ja kehittäjäalustot, mukaan lukien gemini-sovellusliittymä Google AI-studio ja Vertex AI

kuvata Googlen ilmoitus Ensimmäisenä”täysin hybridi-päättelymallina”, 2.5 Flash tarjoaa ainutlaatuisen työkalun tasapainottamisen ja Costing”-prosessin. Suuret volyymitehtävät. Google asettaa suorituskyky-ja kustannussuhteensa asettamalla sen”Pareto Frontieriin”, joka ehdottaa optimaalista tasapainoa tietyille työkuormille.

loppukäyttäjille malli näkyy Gemini App ja verkkosivustolla yksinkertaisesti “2,5 Flash),”GEMIN). 2.0 Flash-ajattelumalli, joka esiintyi kokeellisesti joulukuussa 2024 ja ei koskaan valmistunut siitä vaiheesta.

Lähde: Google

Kehittäjävivut AI: n perusteluille ja kustannus

GEMINI 2.5 FLASH-sovelluksen määrittelevä piirre Gemini API . Kehittäjät voivat vaihtaa “ajattelu”-prosessin kokonaan pois maksimaalisen nopeuden saavuttamiseksi tai mahdollistaa sen monimutkaisten kyselyjen varalta. Lisä rakeisuus tulee säädettävän “ajattelubudjetti” Pohjimmiltaan CAP: n CAP: n laskennallisten rahakkeiden käyttäminen Kyselyn kohdalla. Chatbotit analyyttisiin tehtäviin. Tämä valvontataso mahdollistaa vastauksen laadun, latenssin ja operatiivisten kustannusten välisen kompromissin hallinnan. Tuotanto maksaa 0,60 dollaria miljoonaa merkkiä kohden, kun ajattelu on vammainen, mikä nousee 3,50 dollariin miljoonalle rahakkeelle, kun päättely on aktiivinen. Google asettaa tämän kohtuuttomuuden kustannusrakenteen kilpailukykyisesti Openain O4-Mini-malleihin nähden, vaikka O4-mini osoittaa erinomaisia ​​suorituskykyviitearvoja korkeammalla hintapisteellä.

Hinnoittelurakenne vahvistaa Flashin soveltuvuutta korkean volyymin, kustannusherkät käyttötarkoitukset, kuten yhteenveto, chat-apprit, paineekstit ja tietojen poistot, esimerkit Googlen kehittäjäblogi . src=”https://winbuzzer.com/wp-content/uploads/2025/04/gemini-2.5-flash-price-to-permformance-wical-1024×576.jpg”> Lähde: Google

Sijoita Flash Gemini 2.5-tapahtumassa. julkisesti 9. huhtikuuta, joka otettiin käyttöön mallina, joka eroaa 2,5 pro: n monimutkaisista päättelyominaisuuksista. Huolimatta Flashin nopeudesta, se säilyttää Pro-linjan suuren miljoonan tunnuksen kontekstin ikkunan, jolloin se voi käsitellä laajoja tuloja.

Itse taustalla oleva “ajattelu”-konsepti kehittyi joulukuun 2024 kokeellisesta Gemini 2.0 Flash-mallista. Tämän aikaisemman iteraation tavoitteena oli tarjota päättely läpinäkyvyyden, osittain vastauksena Openain O1-malleihin. Tuon kokeilun suhteen Google Deepmindin päätieteilijä Jeff Dean totesi X: llä, joka on rakennettu 2.0 Flashin nopeuteen ja suorituskykyyn, tämä malli on koulutettu käyttämään ajatuksia sen päättelyn vahvistamiseksi. Ja näemme lupaavia tuloksia, kun lisäämme päätelmäajan laskentaa.”Katso tämä demo, jossa malli ratkaisee fysiikan ongelman ja selittää sen päättelyn. pic.twitter.com/nl0hyj7zfs

-Jeff Dean (@Jeffdean) 19. joulukuuta 2024

, kun apuvälitys”ajatukset”ei ole 2.5 flash, edustaa tämän idean toiminnallista kehitystä.

Google pyrkii hyödyntämään tätä esikatseluvaihetta mallin “dynaamisen ajattelun”parantamiseksi, joka perustuu kehittäjäpalautetta, etenkin tapausten suhteen”missä se ajattelee tai ajattelee”, kuten Doshi mainitsi. Erottelu on edelleen siitä, että kehittäjät saavat rakeisen sovellusliittymän ohjaimet, kun taas nykyinen kuluttajasovellus tarjoaa Flashin yhtenä kokeellisena valintana, todennäköisesti oletuksena olevien päättelyjen kanssa.

, kuten todettiin, kun 2,5 Flash ilmoitettiin, tämä julkinen esikatselu saapuu ilman yksityiskohtaisia ​​teknisiä tai turvallisuusraportteja. Tämä läpinäkyvyyden puute jatkuu kuviota, joka nähdään joihinkin viimeaikaisiin AI-julkaisuihin, houkutteleen valvontaa, etenkin malleille, jotka tehdään laajasti saataville. Vaikka Google suunnittelee tulevaa kehitystä, kuten paikan päällä saatavuus ja uuden TPU: n hyödyntäminen, välitön askel sisältää todellisen maailman tietojen keräämisen 2.5 Flashin ohjaamiseksi kohti potentiaalista yleistä julkaisua.

Categories: IT Info