Solo alcuni giorni dopo che si vociferava di un ritardo, Google ha presentato ufficialmente la sua vivace risposta alla decisione di Microsoft e i progressi di OpenAI nell’intelligenza artificiale generativa con una nuova suite di modelli denominata collettivamente Gemini. Il colosso della tecnologia ha sviluppato tre versioni distinte del modello Gemini AI, ciascuna destinata a diversi livelli di complessità computazionale e ambienti applicativi.
[contenuto incorporato]
Il portfolio Gemini: Ultra, Pro e Nano
In prima linea nell’annuncio di Google c’è Gemini Ultra, realizzato per gestire”attività altamente complesse”con un netto vantaggio in termini di prestazioni. Nel frattempo, Gemini Pro è destinato a fornire funzionalità robuste e versatili in uno spettro più ampio di attività. Al contrario , Gemini Nano è progettato con un obiettivo più mirato: portare le funzionalità di intelligenza artificiale direttamente sui dispositivi attraverso attività che richiedono meno peso computazionale.
Google sostiene che Gemini Ultra supera nella maggioranza il GPT-4 di OpenAI, l’attuale motore dietro Copilot di Microsoft di parametri di riferimento significativi del modello linguistico. Con una mossa strategica volta a intrecciare diversi tipi di dati, Google ha sviluppato Gemini con funzionalità multimodali fin dall’inizio, garantendo che potesse comprendere ed elaborare input come testo, immagini, audio e video in modo più completo rispetto a qualsiasi modello esistente di tipo simile.
[contenuto incorporato]
Implicazioni per programmatori e consumatori
Google punta i riflettori sull’abilità del modello con il codice, affermando che il primo La versione di Gemini può comprendere e generare autonomamente frammenti di codice di qualità in linguaggi di programmazione ampiamente utilizzati come Python, Java, C++ e Go. Questo aspetto lo contraddistingue come un modello fondamentale e leader per le applicazioni di codifica.
“Abbiamo testato rigorosamente i nostri modelli Gemini e valutato le loro prestazioni su un’ampia varietà di attività”, spiega Google nel suo annuncio.”Da dalla comprensione naturale di immagini, audio e video al ragionamento matematico, le prestazioni di Gemini Ultra superano gli attuali risultati all’avanguardia su 30 dei 32 benchmark accademici ampiamente utilizzati nella ricerca e nello sviluppo di modelli linguistici di grandi dimensioni (LLM).
Con un punteggio del 90,0%, Gemini Ultra è il primo modello a superare gli esperti umani su MMLU ( massiccia comprensione linguistica multitasking), che utilizza una combinazione di 57 materie come matematica, fisica, storia, diritto, medicina ed etica per testare sia la conoscenza del mondo che le capacità di risoluzione dei problemi.”
Contemporaneamente, l’azienda ha ha lanciato un aggiornamento al suo chatbot Bard, incorporando Gemini Pro per arricchire le capacità avanzate di ragionamento e comprensione dello strumento, inizialmente disponibile in inglese. Google prevede ulteriori miglioramenti con la futura integrazione di Gemini Ultra in Bard, promettendo funzionalità ancora più sofisticate.
[contenuto incorporato]
Anche gli utenti di Pixel 8 Pro sperimenteranno la forza di Gemini modello, poiché Google rilascia un aggiornamento di funzionalità che inserisce il Gemini Nano integrato nel dispositivo nello smartphone. Consente al dispositivo di riassumere l’audio registrato come conversazioni e interviste, nonché di proporre risposte suggerite ai messaggi.
Nel portare avanti tutto ciò, Google sta creando le basi per una forte concorrenza nel regno dell’intelligenza artificiale generativa, fornendo nuovi e potenti strumenti su varie piattaforme e segnalano la continua innovazione nel settore.