Le nouveau modèle de réflexion Flash Gemini 2.0 de Google défie l'o1 Pro d'OpenAI avec d'excellentes performances

Google a annoncé Gemini 2.0 Flash Thinking, un modèle de raisonnement expérimental conçu pour résoudre des problèmes complexes à l’aide de plusieurs types de données. Le nouveau modèle permet aux utilisateurs de voir les étapes nécessaires pour arriver à une réponse, offrant ainsi un aperçu de son processus analytique.

Gemini 2.0 Flash Thinking est une réponse directe aux modèles de raisonnement o1 d’OpenAI, Google mettant l’accent sur la transparence et la vitesse comme caractéristiques clés de sa conception.

Notre modèle le plus réfléchi à ce jour 🙂 https://t.co/xIz3w5dtGJ

— Sundar Pichai (@sundarpichai) 19 décembre 2024

Processus de raisonnement Montré étape par étape

Une caractéristique clé L’une des caractéristiques de Gemini 2.0 Flash Thinking est de rendre son processus de raisonnement compréhensible pour les utilisateurs. Cela contraste avec certains systèmes d’IA avancés où le processus de prise de décision est souvent flou.

Contrairement aux modèles de raisonnement o1 d’OpenAI, le nouveau modèle de Google permet aux utilisateurs de suivre ses étapes cognitives via une interface utilisateur. Selon la documentation officielle de Google, le « Mode réflexion » de ce modèle offre des capacités de raisonnement plus puissantes que le modèle Flash Gemini 2.0 standard.

Cette fonctionnalité répond au problème de la « boîte noire » souvent associée à l’IA, en alignant les modèle dans le but de rendre ses opérations plus compréhensibles. Les premières observations suggèrent que le modèle peut résoudre efficacement et rapidement des problèmes qui ont été difficiles pour d’autres systèmes d’IA.

Traitement multimodal intégré

Une autre fonctionnalité importante L’un des points forts de Gemini 2.0 Flash Thinking réside dans sa capacité à traiter les entrées d’images en même temps que le texte. Alors que l’o1 d’OpenAI fonctionnait initialement uniquement avec du texte avant d’ajouter des fonctionnalités d’image ultérieurement, le modèle de Google est conçu pour gérer plusieurs types de données dès le début.

Cette fonctionnalité intégrée permet au modèle de traiter des situations complexes nécessitant l’analyse de différents types d’informations. Par exemple, le modèle a été capable de résoudre des énigmes nécessitant l’utilisation à la fois de texte et d’images, démontrant ainsi sa capacité à travailler avec différents formats de données. Les développeurs peuvent actuellement accéder à ces fonctionnalités via Google AI Studio et Vertex AI. .

Résultats du benchmark

Premiers résultats du classement du benchmark Chatbot Arena pour les utilisateurs testés Le modèle Gemini-2.0-Flash-Thinking-exp-1219 présente des performances généralement supérieures par rapport aux modèles OpenAi o1 répertoriés (o1-preview et o1-mini).

Gemini-2.0-Flash-Pensée n°1 dans toutes les catégories ! pic.twitter.com/mRctNA31B9

— lmarena.ai (anciennement lmsys.org) (@lmarena_ai) 19 décembre 2024

Contre o1-preview, Gemini-2.0-Flash-Thinking le surpasse considérablement en termes de performances globales, dans l’ensemble avec contrôle du style, écriture créative, suivi des instructions et requête plus longue. Ils atteignent le même rang dans les invites matérielles, les invites matérielles avec contrôle de style, le codage et les mathématiques. Par rapport à o1-mini, Gemini-2.0-Flash-Thinking le surpasse considérablement en termes de performances globales, globales avec contrôle de style, invites matérielles, invites matérielles avec contrôle de style, écriture créative, suivi des instructions et plus. Requête. Ils atteignent le même rang en codage et en mathématiques.

Il est important de noter que cette comparaison inclut uniquement les versions « aperçu » et « mini » des modèles o1. Les versions stables de o1 et o1 Pro sont absentes de cet aperçu, ce qui signifie qu’il ne reflète pas une comparaison avec les versions stables potentiellement plus performantes de la famille de modèles o1.

Cependant, sur la base du Selon les données disponibles, Gemini-2.0-Flash-Thinking-exp-1219 démontre un profil de performances considérablement plus élevé par rapport aux modèles o1-preview et o1-mini.

Détails de Gemini 2.0 Flash Thinking

Gemini 2.0 Flash Thinking est actuellement disponible à titre expérimental dans Google AI Studio. Il est construit sur la base du modèle Gemini 2.0 Flash récemment publié.

Jeff Dean, scientifique en chef de Google DeepMind, a expliqué que le modèle est « entraîné à utiliser des pensées pour renforcer son raisonnement ». Il a également noté « des résultats prometteurs lorsque nous augmentons le temps de calcul de l’inférence », faisant référence à la quantité de ressources informatiques utilisées lors du traitement des requêtes.

Présentation de Gemini 2.0 Flash Thinking, un modèle expérimental qui montre explicitement ses pensées.

Construit sur Flash 2.0 vitesse et performances, ce modèle est entraîné à utiliser les pensées pour renforcer son raisonnement.

Et nous voyons des résultats prometteurs lorsque nous augmentons le temps d’inférence…

— Jeff Dean (@JeffDean) 19 décembre 2024

Dean a également partagé une démo dans laquelle le modèle a résolu un problème de physique complexe.

Vous voulez voir Gemini 2.0 Flash Thinking en action ? Découvrez cette démo où le modèle résout un problème de physique et explique son raisonnement. pic.twitter.com/Nl0hYj7ZFS

— Jeff Dean (@JeffDean) Décembre 19 novembre 2024

Le modèle a une limite de 32 000 jetons pour l’entrée et peut générer des sorties jusqu’à 8 000 jetons de longueur. La documentation de Google indique que”Le mode Réflexion est capable de capacités de raisonnement plus fortes dans ses réponses. que le modèle de base Gemini 2.0 Flash”, soulignant ses capacités analytiques améliorées.

Actuellement, le le modèle est proposé gratuitement dans Google AI Studio, mais la documentation indique que certaines intégrations, comme la fonctionnalité de recherche Google, ne sont pas encore disponibles. Le modèle est particulièrement conçu pour les tâches de « compréhension multimodale, de raisonnement » et de « codage ».

Concurrence avec le Premium d’OpenAI. Offrant

L’introduction de Gemini 2.0 Flash Thinking vient peu de temps après le lancement d’Openai Chatgpt Pro La version complète de l’O1 Reason Modelon le 5 décembre, mettant en évidence la concurrence croissante dans le domaine de l’IA avancée. p>

Le lancement par Google de Gemini 2.0 Flash Thinking intervient alors qu’OpenAI a récemment établi ses offres premium pour des capacités de raisonnement avancées. Alors que le mode o1 pro d’OpenAI met l’accent sur les performances grâce à des ressources de calcul accrues, Gemini 2.0 Flash Thinking de Google met l’accent sur la transparence de son processus de raisonnement.

Cette différence met en évidence les stratégies contrastées utilisées dans le développement de l’IA, certaines se concentrant sur la puissance de calcul et d’autres privilégiant la compréhension et la confiance des utilisateurs.

Le nouveau modèle de réflexion Flash Gemini 2.0 de Google défie l’o1 Pro d’OpenAI avec d’excellentes performances

Published by All Things Windows on December 19, 2024

Processus de raisonnement Montré étape par étape

Traitement multimodal intégré

Résultats du benchmark

Détails de Gemini 2.0 Flash Thinking

Concurrence avec le Premium d’OpenAI. Offrant

IT Info

Le nouveau simulateur Genesis AI rend la formation des robots 81 fois plus rapide

IT Info

ChatGPT d’OpenAI est désormais accessible gratuitement via le service d’appel 1-800-CHATGPT

IT Info

Comment activer, désactiver et configurer la lecture automatique dans Windows 11

Le nouveau modèle de réflexion Flash Gemini 2.0 de Google défie l’o1 Pro d’OpenAI avec d’excellentes performances

Published by All Things Windows on December 19, 2024

Processus de raisonnement Montré étape par étape

Traitement multimodal intégré

Résultats du benchmark

Détails de Gemini 2.0 Flash Thinking

Concurrence avec le Premium d’OpenAI. Offrant

Related Posts

IT Info

Le nouveau simulateur Genesis AI rend la formation des robots 81 fois plus rapide

IT Info

ChatGPT d’OpenAI est désormais accessible gratuitement via le service d’appel 1-800-CHATGPT

IT Info

Comment activer, désactiver et configurer la lecture automatique dans Windows 11