Google shtyu modelin e tij Gemini 2.5 Flash AI në vrojtim publik dje, duke e bërë atë të arritshëm përmes kanaleve të shumta: Aplikacioni Gemini i përballur nga konsumatori, dhe platformat e zhvilluesve përfshirë API Gemini përmes google ai studio dhe njoftimi i Google Si modeli i parë i tij”i dhënë për të dhënë një model të plotë të tij,”Detyrat me vëllim të lartë. Google pozicionon raportin e tij të performancës ndaj kostos si duke e vendosur atë në”Pareto Frontier”, duke sugjeruar një ekuilibër optimal për ngarkesa të caktuara të punës. 2.0 Modeli i Mendimit Flash që u shfaq në mënyrë eksperimentale në Dhjetor 2024 dhe, kurrë nuk u diplomua në atë fazë. src=”të dhëna: imazh/svg+xml; nitro-impty-id=mty4mzoxotiy-1; base64, phn2zyb2awv3qm94psiwidagnjk3idewmj QiiHdpZhropsi2otciighlawdodd0imtayncigeg1sbnm9imh0dha6ly93d3cudzmub3jnlziwmdavc3znij48l3n2zz4=”>
Kjo përsëritje 2.5 përshkruhet se ofron aftësi të përmirësuar në mënyrë të konsiderueshme të arsyetimit në krahasim me gjenerimin 2.0 Flash, ndërsa është krijuar për të qenë më i shpejtë dhe më i lirë se sa Binjakët e Lartë të Lartë 2.5 Pro të njoftuar në Mars. Versioni i aplikacionit të konsumatorit aktualisht mbështet veçori si kanavacë e Google për kodin dhe rafinimin e tekstit, megjithëse një Google tregoi se mbështetja e thellë e hulumtimit do të pasojë më vonë. href=”https://developers.googleblog.com/en/start-building-with-gemini-25-flash/”target=”_ bosh”> gemini api . Zhvilluesit mund të ndryshojnë procesin e”mendimit”plotësisht për shpejtësinë maksimale ose ta mundësojnë atë për pyetje komplekse. Granulariteti i mëtutjeshëm vjen përmes rregullueshëm “Buxhetet Detyrat analitike. Ky nivel i kontrollit lejon një menaxhim të saktë të tregtisë midis cilësisë së përgjigjes, latencës dhe kostos operacionale. Prodhimi kushton 0.60 dollarë për milion shenja me të menduarit me aftësi të kufizuara, duke u rritur në 3.50 dollarë për milion shenja kur arsyetimi është aktiv. Google pozicionon këtë strukturë të kostos jo të arsyeshme në mënyrë konkurruese kundër modeleve si Openai’s O4-Mini, megjithëse O4-MINI demonstron standarde të performancës superiore në një pikë çmimi më të lartë. href=”https://developers.googleblog.com/en/start-building-with-gemini-25-flash/”target=”_ bosh”> blogu i zhvilluesit të Google .
Burimi: Google
Pozicionimi i Flash në familjen Binjakët dhe evolucioni i tij
Flash Binjakët 2.5 u diskutua për herë të parë publikisht në 9 Prill, i prezantuar si një model i dallueshëm nga aftësitë komplekse të arsyetimit të 2.5 Pro. Megjithë përqendrimin e Flash në shpejtësinë, ajo ruan dritaren e madhe të kontekstit të Token Token për linjën Pro, duke e lejuar atë të trajtojë inputet e gjera. Se përsëritja e hershme synonte të siguronte transparencën e arsyetimit, pjesërisht si përgjigje ndaj modeleve O1 të Openai. Lidhur me atë eksperiment, Jeff Dean, shkencëtari kryesor i Google Deepmind, deklaroi në X,”E ndërtuar në shpejtësinë dhe performancën e 2.0 Flash, ky model është i trajnuar të përdorë mendime për të forcuar arsyetimin e tij. Dhe ne shohim rezultate premtuese kur rrisim llogaritjen e kohës së konkluzionit.”Shikoni këtë demonstrim ku modeli zgjidh një problem të fizikës dhe shpjegon arsyetimin e tij. pic.twitter.com/nl0hyJ7zfs