de la Premium Access la Public Libere în o săptămână <
doar cinci zile mai devreme, pe 25 martie, Gemini 2.5 Pro a fost pusă la dispoziție exclusiv pentru a plăti abonații din Gemeni Advanced și utilizatorii Google AI Studio. Această versiune a fost limitată la 19,99 USD/lună Google One AI Premium Plan. Până la sfârșitul săptămânii, versiunea experimentală a aceluiași model a devenit implicită pentru toată lumea care folosea aplicația Gemini, inclusiv pe cele de pe nivelul liber.
Această expansiune bruscă sugerează motivații multiple: scalarea adoptării, accelerarea ciclurilor de feedback și poziționarea Gemini ca un adevărat concurent la modele de la OpenAI, Antropic și Xai. De asemenea, reflectă încrederea în performanța și pregătirea din lumea reală a modelului, chiar și într-o formă experimentală.
Un model axat pe raționament cu noi compromisuri
Gemeni 2.5, cea mai mare schimbare a lui se află în modul în care crede. Spre deosebire de modelele generative tradiționale care se bazează pe predicții cu un singur pas, acest model efectuează verificări logice în mai multe etape pentru a-și consolida raționamentul.
Că fereastra de context larg permite GEMINI să proceseze cărți întregi, contracte legale sau bazine de cod într-o singură dată. Pe referința MRCR 128K, care testează înțelegerea pe conținut de formă lungă, Gemeni a obținut o precizie de 91,5% și a păstrat 83,1% performanță la scară completă-în mod semnificativ înaintea GPT-4.5, 36,3%. href=”https://lmarena.ai/?leaderboard”target=”_ blank”> Topping the Lmarena classboard cu aproape 40 de puncte.
la teste orientate pe matematică, cum ar fi Aime 2024, Gemini a ajuns la 92,0%cu acuratețe, bătând GPT-4.5 (36.7%) și profund R1 (79.8%). Pentru sarcinile multimodale care implică atât text, cât și imagini, acesta a obținut 81,7% pe referința MMMU-din nou înaintea Claude 3.7 Sonet și GPT-4.5.
Cu toate acestea, performanța variază în funcție de categorii. Gemeni a marcat 52,9% pe SimpleQA, un test de rechemare faptică, cu 62,5% din GPT-4.5. În scenarii de inginerie software autonomă (codificare agentică), sonetul Claude 3.7 duce în continuare cu 70,3%, în timp ce Gemeni urmează la 63,8%.
sursă: Google
Instrumente pentru dezvoltatori și caracteristici multimodale
În timp ce O3-MINI High’s High conduce în generarea de coduri live (74,1% pe LiveCodebench), Gemini 2.5 Pro deține propriul său la 70,4%. Realizează și mai bine în sarcinile de editare a codurilor. Pe referința Aider Polyglot-proiectată pentru a testa modificarea codului multilingv-GEMINI scor 74,0%, eliminând cele mai recente modele ale lui Claude și Deepseek.
suportul autohton al lui Gemini pentru inputuri multimodale înseamnă că poate prelucra imagini, video, cod și text în aceeași interogare. Această capacitate se extinde la instrumente precum Gemini Live, care permite asistența bazată pe ecran și cameră. Google a integrat, de asemenea, Gemini în instrumente de spațiu de lucru precum Gmail, Docs și Drive-oferind rezumate inteligente, îmbunătățiri de căutare prin e-mail și ajutoare de navigare a documentelor.
Android Takeover și răspunsul utilizatorului
Extinderea Gemini depășește doar modelele îmbunătățite. De asemenea, înlocuiește Google Assistant ca AI Voice implicit pe dispozitivele Android. Schimbarea a atras reacții mixte. Unii utilizatori au lăudat performanța Gemeni în sarcini precum codificarea și cercetarea.
alții au criticat schimbarea, citând caracteristici de asistent lipsă și interacțiuni vocale mai puțin intuitive.
Între timp, Google a făcut ca capacitățile AI ale Gemini să fie mai accesibile în instrumentele de spațiu de lucru, inclusiv Gmail și documente. Gemenii încorporează, de asemenea, istoricul căutării pentru răspunsuri personalizate-alintând la suprapuneri viitoare între AI și căutarea tradițională. Dacă această strategie plătește va depinde de modul în care utilizatorii răspund.