Google on antanut edistyneimmän AI-mallin, Gemini 2.5 Pro (kokeellinen), joka on kaikkien ilmaisen Gemini-verkkosovelluksen kaikkien käyttäjien käytettävissä-vanhemman version korvaaminen ja aiemman paywallin poistaminen. Sen sijaan käyttäjät huomasivat muutoksen itse Gemini-verkkosovelluksessa, jossa vastaukset johtuivat nyt”Gemini 2.5 Pro (Exp)”kohden oletusarvoista. Ilmaiset käyttäjät voivat nyt valita Gemini 2.5 Pro: n mallin valitsimen kautta. Tämä kiireellisyys viittaa strategian muutokseen-Google ei enää rajoita sen ylimmän tason AI: n palkkaseinän takana, vaan työntää sitä kaikille ilmaiseksi.
Gemini 2.5 Pro on poistumassa 🚀🚀🚀
joukkue sprinttiä, TPU: t juoksevat kuumana, ja haluamme saada älykkäimmän mallimme useampaan ihmisten käsiin. href=”https://t.co/eqcjwwvhxj”Target=”_blank”> https://t.co/eqcjwwvhxj
-Google Gemini App (@Geminiapp) 29. maaliskuuta 2025
PRIMIIUMISTA JÄLKEEN JULKISTA JULKISTA JÄLKEEN VIIKKO
PRIPIIUMISTA JÄLKEEN JULKAISIN Vain viisi päivää aikaisemmin, 25. maaliskuuta, Gemini 2.5 Pro asetettiin saataville yksinomaan Gemini Advanced-tilaisuuksien ja Google AI-studion käyttäjille. Tämä versio oli ensin rajoitettu 19,99 dollaria/kk Google One AI Premium-suunnitelmaan. Viikon loppuun mennessä saman mallin kokeellisesta versiosta tuli oletus kaikille, jotka käyttävät Gemini-sovellusta, mukaan lukien vapaan tason,
Tämä äkillinen laajennus viittaa moniin motivaatioihin: adoption skaalaaminen, palautekyklien kiihdyttäminen ja Geminin sijainti tosi kilpailija malleille Openaiista, antropista ja XAI: sta. Se heijastaa myös luottamusta mallin suorituskykyyn ja reaalimaailman valmiuteen, jopa kokeellisessa muodossa. Toisin kuin perinteiset generatiiviset mallit, jotka luottavat yhden läpäisevään ennusteisiin, tämä malli suorittaa monivaiheisen loogisen varmennuksen vahvistamiseksi sen päättelyksi. 15 MRCR 128K: n vertailuarvossa, joka testaa ymmärrystä pitkän muodon sisällön välillä, Gemini saavutti 91,5%: n tarkkuuden ja säilytti 83,1%: n suorituskyvyn täysimittaisessa-huomattavasti ennen GPT-4,5: n 36,3%. href=”https://lmarena.ai/?leaderboard”Target=”_ tyhjä”> Lmarena-tulostaulun täyttäminen lähes 40 pisteellä.
matematiikan keskittymistesteissä, kuten Aime 2024, Gemini saavutti 92,0%: n tarkkuuden, lyömällä GPT-4,5 (36,7%) ja syvän R1 (79.8. Multimodaaliset tehtävät, joihin sisältyy sekä tekstiä että kuvia, se sai 81,7% MMMU-vertailuarvoon-Claude 3.7 Sonnet ja GPT-4,5. Gemini teki 52,9% SimpleQA: sta, tosiasiallisesta muistamistestistä, jäljittäen GPT-4,5: n 62,5%. Autonomisissa ohjelmistotekniikan skenaarioissa (agenttinen koodaus) Claude 3.7 Sonnet johtaa edelleen 70,3%: lla, kun taas Gemini polut 63,8%. src=”data: kuva/svg+xml; nitro-namty-id=mtcxmzoxode4-1; base64, phn2zyb2awv3qm94psiwidagmtaynca2mjkiihih dpzhropsixmdi0iibozwlnahq9ijyyosigeg1sbnm9imh0dha6ly93d3cudzmub3jnlziwmdavc3znij48l3n2zz4=”> Lähde: Google
kehittäjätyökalut ja multimodaaliset ominaisuudet
Openain O3-mini korkeat johdot live-koodin luomisessa (74,1% Livecodebenchissä), Gemini 2.5 Pro omistaa omansa 70,4%. Se toimii vielä paremmin koodin muokkaustehtävissä. Aider Polyglot-vertailuarvossa-suunniteltu monikielisen koodin modifikaation testaamiseksi-GMINI-pisteet 74,0%, Clauden ja Deepseekin uusimpien mallien reunustaminen. Tämä kyky ulottuu työkaluihin, kuten Gemini Live, joka mahdollistaa näytön ja kamerapohjaisen avun. Google on myös integroinut Gemini työtilatyökaluihin, kuten Gmail, Docs ja Drive-tarjoamalla älykkäitä yhteenvetoja, sähköpostiosoitteiden parannuksia ja asiakirjojen navigointiapuja.
Android-haltuunotto ja käyttäjän vastaus
Geminin laajennus ylittää vain parannetut mallit. Se korvaa myös Google Assistant-sovelluksen ANDROID-laitteiden oletusääninä. Muutos on saanut sekoitettuja reaktioita. Jotkut käyttäjät ovat kiitelleet Geminin suorituskykyä tehtävissä, kuten koodaus ja tutkimukset.
toiset ovat kritisoineet muutosta viitaten puuttuviin avustajaominaisuuksiin ja vähemmän intuitiivisiin äänivuorovaikutuksiin. Kaksoset sisällyttävät myös hakuhistoriaa henkilökohtaisia vastauksia-AI: n ja perinteisen haun välisten tulevien päällekkäisyyksien saavuttaminen. Se, kannattaako tämä strategia, riippuu siitä, miten käyttäjät reagoivat.