Itinulak ng Google ang modelo ng Gemini 2.5 Flash AI sa Public Preview kahapon, ginagawa itong ma-access sa pamamagitan ng maraming mga channel: ang consumer-facing gemini app, at mga platform ng developer kasama ang gemini api sa pamamagitan ng google ai studio at vertex ai . href=”https://blog.google/products/gemini/gemini-2-5-flash-preview/” target=”_blank”>Google’s announcement as its first “fully hybrid reasoning model,”2.5 Flash uniquely offers developers explicit controls over the AI’s “thinking”process, aiming to provide a flexible tool balancing performance, cost, and latency for mga gawain na may mataas na dami. Posisyon ng Google ang ratio ng pagganap-sa-gastos na ito bilang paglalagay nito sa”Pareto Frontier,”na nagmumungkahi ng isang pinakamainam na balanse para sa ilang mga workload. 2.0 modelo ng pag-iisip ng flash na lumitaw sa eksperimento noong Disyembre 2024 at, hindi kailanman nagtapos mula sa phase na iyon.
Ang 2.5 na pag-ulit na ito ay inilarawan bilang nag-aalok ng malaking pinahusay na kakayahan sa pangangatuwiran kumpara sa 2.0 flash henerasyon, habang inhinyero na mas mabilis at mas mura kaysa sa high-end na Gemini 2.5 Pro na inihayag noong Marso. Ang bersyon ng Consumer App ay kasalukuyang sumusuporta sa mga tampok tulad ng Google’s Canvas para sa Code at Text Refinement, kahit na ang isang Google ay nagpapahiwatig ng malalim na suporta sa pananaliksik ay susundan sa ibang pagkakataon. href=”https://developers.googleblog.com/en/start-building-with-gemini-25-flash/”target=”_ blangko”> gemini api . Ang mga nag-develop ay maaaring i-toggle ang proseso ng”pag-iisip”na ganap na off para sa maximum na bilis o paganahin ito para sa mga kumplikadong query. Ang karagdagang butil ay nagmumula sa pamamagitan ng adjustable “Pag-iisip ng mga badyet,”Mga chatbots sa mga gawain na analitikal. Ang antas ng kontrol na ito ay nagbibigay-daan para sa tumpak na pamamahala ng trade-off sa pagitan ng kalidad ng pagtugon, latency, at gastos sa pagpapatakbo. Ang output ay nagkakahalaga ng $ 0.60 bawat milyong mga token na may pag-iisip na hindi pinagana, na tumataas sa $ 3.50 bawat milyong mga token kapag ang pangangatuwiran ay aktibo. Posisyon ng Google ang di-makatwirang istraktura ng gastos na mapagkumpitensya laban sa mga modelo tulad ng OpenAi’s O4-Mini, kahit na ang O4-Mini ay nagpapakita ng higit na mahusay na mga benchmark ng pagganap sa isang mas mataas na punto ng presyo. href=”https://developers.googleblog.com/en/start-building-with-gemini-25-flash/”target=”_ blangko”> blog ng developer ng Google . src=”data: imahe/svg+xml; nitro-empty-id=mtcwnzoxmjm4-1; base64, phn2zyb2awv3qm94psiwidagmtaynca1nzyiih dpzhopsixmdi0iibozwlnahq9iju3niigeg1sbnm9imh0dha6ly93d3cudzmub3jnlziwiWmdavc3znij48l3n2zz4=”source: Google
pagpoposisyon ng flash sa pamilyang Gemini at ang ebolusyon nito
Sa kabila ng pokus ng Flash sa bilis, pinapanatili nito ang malaking 1 milyong token na window window na katangian ng pro line, na pinapayagan itong hawakan ang malawak na mga input. Iyon ang naunang pag-ulit na naglalayong magbigay ng pangangatuwiran na transparency, na bahagyang bilang tugon sa mga modelo ng Openai ng OpenAi. Tungkol sa eksperimento na iyon, si Jeff Dean, ang punong siyentipiko ng Google Deepmind, ay nakasaad sa X,”Itinayo sa bilis at pagganap ng Flash ng Flash, ang modelong ito ay sinanay na gumamit ng mga saloobin upang palakasin ang pangangatuwiran nito. At nakikita natin ang mga promising na resulta kapag nadaragdagan natin ang pag-compute ng oras.”Suriin ang demo na ito kung saan nalulutas ng modelo ang isang problema sa pisika at ipinapaliwanag ang pangangatuwiran nito. pic.twitter.com/nl0hyj7zfs
-jeff dean (@jeffdean) Disyembre 19, 2024 Kinakatawan ang pagganap na ebolusyon ng ideyang ito. Nilalayon ng Google na magamit ang phase ng preview na ito upang pinuhin ang”dynamic na pag-iisip”ng modelo batay sa feedback ng developer, lalo na tungkol sa mga pagkakataon na”kung saan ito ay hindi nag-iisip o labis na think,”tulad ng nabanggit ni Doshi. Ang pagkakaiba ay nananatiling ang mga developer ay nakakakuha ng mga butil na kontrol ng API, habang ang kasalukuyang app ng consumer ay nag-aalok ng flash bilang isang solong eksperimentong pagpipilian, malamang na may pangangatuwiran na pinagana nang default. Ang kakulangan ng transparency ay nagpapatuloy ng isang pattern na nakikita sa ilang mga kamakailang paglabas ng AI, na umaakit ng pagsisiyasat, lalo na para sa mga modelo na malawakang magagamit. Habang pinaplano ng Google ang mga pag-unlad sa hinaharap tulad ng pagkakaroon ng mga nasasakupang lugar at pag-agaw ng mga bagong TPU, ang agarang hakbang ay nagsasangkot ng pangangalap ng data ng real-world upang gabayan ang 2.5 flash patungo sa isang potensyal na pangkalahatang paglabas.