Google sta avanzando in modo significativo i suoi modelli di intelligenza artificiale Gemini 2.5, evidenziati dall’introduzione di”Deep Think”, una modalità di ragionamento sperimentale per il suo fiore all’occhiello Gemini 2.5 Pro. Rivelato a Google I/O 2025, Deep Think mira ad affrontare la matematica e la codifica altamente complesse consentendo al modello di prendere in considerazione molteplici ipotesi prima di rispondere. Questo sviluppo, unito ai miglioramenti delle prestazioni per il flash Gemini 2.5 orientato alla velocità e nuove funzionalità su entrambi i modelli, incluso l’output audio nativo, sottolinea l’impegno di Google a fornire strumenti di AI più potenti e versatili.

The Href=”href=”href”>”>”>”>”>”>”>”>”>”>”>”>”>”>”>”. Pensa”Funzione , come dettagliato da Google DeepMind, è progettato per elevare le capacità analitiche di Gemini 2.5 Pro. Demis Hassabis, capo di Google DeepMind, ha dichiarato durante un briefing stampa che Deep Think”spinge le prestazioni del modello ai suoi limiti”, utilizzando ricerche all’avanguardia. Questo approccio potrebbe essere simile alle tecniche utilizzate da concorrenti come Openai.

I primi risultati mostrano un Think Deep Think che abilita Gemini 2.5 Pro di superare la esigente valutazione della codifica LiveCodebench e sovraperformare O3 di Openi sul test delle competenze multimodaliche MMMU. Tuttavia, Google sta adottando un approccio cauto, inizialmente rilasciando Deep Think ai tester fidati tramite gemini api Per ulteriori valutazioni di sicurezza, con disponibilità su vertice Ai per seguire presto.

> Fonte: Google

insieme a questi miglioramenti di fascia alta, anche Gemini 2.5 Flash, ottimizzato per velocità ed efficienza, ha ricevuto un aggiornamento sostanziale. Il modello ora vanta prestazioni migliorate nelle attività di ragionamento, multimodalità, codifica e contesto a lungo href=”https://cloud.google.com/vertex-ai?hl=en”target=”_ blank”> vertex ai e il app gemina Per i consumatori, con la disponibilità generale per la produzione di produzione in primo piano. larghezza=”960″altezza=”1024″src=”Dati: immagine/svg+xml; nitro-empty-id=mty1ntoxmjq1-1; base64, pHn2zyb2awv3qm94psiwidagotywidewmjqiih dpzhropi5njaiighlawdodd0imtayncigeg1sbnm9imh0dha6ly93d3cudzmub3jnlziwmdavc3znij48l3n2zz4=”> fonte: Google

Questo si basa sulla sua introduzione di aprile, in cui è stata presentata come soluzione per attività ad alta frequenza con”calcolo dinamico e controllabile”. Geotab, una società di gestione della flotta, annotata in un

Interazione migliorata e capacità più ampie

La serie Gemini 2.5 ora incorpora l’audio nativo tramite API live , consentendo conversazioni di intelligenza artificiale più naturali ed espressive. Ciò include l’input audiovisivo e la possibilità per gli utenti di dirigere il tono e l’accento dell’IA e persino istruirlo a utilizzare strumenti come la ricerca. Le caratteristiche dell’API dal vivo sperimentale includono il dialogo affettivo, che consente al modello di rilevare e rispondere alle emozioni degli utenti e l’audio proattivo per i segnali di risposta discernenti in ambienti rumorosi.

Inoltre, nuove anteprime del testo per i modelli di sicurezza, con la capacità di catturare sottili sottili come Whispers. sostenuto con salvaguardie avanzate , secondo Google DeepMind, contro minacce come le iniezioni di prompt indirette. Guardando avanti, Project Mariner, un agente di intelligenza artificiale sperimentale che funziona come estensione cromata per navigare e interagire autonomamente con i siti Web, sarà integrato nell’API Gemini e nell’IA Vertex. Gemini Live, con una condivisione di fotocamere e schermo alimentata da Project Astra, sta ora lanciando a tutti gli utenti su iOS.

[contenuto incorporato]

Focus sullo sviluppatore e l’evoluzione dell’ecosistema

Google continua a perfezionare i ragioni per i motivi del modello. I budget di pensiero, che consentono il controllo sui costi computazionali, vengono estesi da Flash a 2,5 Pro. Questi aggiornamenti fanno parte di un ciclo di iterazione rapida per Gemelli. Un’edizione”I/O”di Gemini 2.5 Pro è già stata rilasciata il 6 maggio, concentrandosi su migliori capacità di codifica.

Questa rapida distribuzione ha a volte disegnato il controllo. La scheda modello iniziale per Gemini 2.5 Pro, pubblicata settimane dopo la sua disponibilità pubblica a fine marzo, è stata definita”scarsa”da Kevin Bankston del Center for Democracy and Technology. Questa preoccupazione alimentata per la trasparenza nella sicurezza dell’IA poiché i modelli vengono rapidamente portati sul mercato.

L’app Gemini AI Chatbot ora serve oltre 400 milioni di utenti mensili attivi, una cifra annunciata dal CEO Sundar Pichai a I/O 2025.

nuovi livelli di abbonamento e integrazioni

Gemini è anche integrato più profondamente in altri prodotti di Google. Gemini sarà disponibile nel browser Chrome su desktop per gli abbonati AI Pro e Ultra per chiarire o riassumere i contenuti Web. Inoltre, l’agente di prototipazione delle app di Firebase Studio utilizza ora gli ultimi modelli Gemini 2.5 e nuove funzionalità API come l’uscita audio nativa. Queste mosse illustrano la strategia di Google per incorporare la sua intelligenza artificiale sempre più sofisticata attraverso il suo ecosistema, con l’obiettivo di rendere i suoi strumenti più intelligenti e interattivi.

Categories: IT Info