Openai a inversé sa décision de février d’annuler le modèle O3, annonçant plutôt qu’il lancera O3 et O4-MinI dans les prochaines semaines-dépôt GPT-5 en attente jusqu’à cette année. La mise à jour a été confirmée par le PDG Sam Altman dans un article sur X, où il a déclaré que la société maintiendrait désormais des modèles axés sur le raisonnement séparés de ses modèles de langage générale.

“Changement de plans: nous allons publier O3 et O4-MinI après tout, il y a des raisons pour des raisons pour des raisons et les plus excitantes, mais la plus excitante, mais qui fait que ce qui va de décembre. Modèles de chat/d’achèvement.”Altman a écrit. Il a ajouté:”Nous sommes ravis des performances que nous voyons de O3 en interne.”

Changement de plans: nous allons libérer O3 et O4-MinI après tout, probablement dans quelques semaines, puis faire GPT-5 dans quelques mois.

Il y a un tas de raisons, mais la plus excitante est que nous allons être en mesure de rendre GPT-5 beaucoup mieux que nous à l’origine…

-Sam Altman (@sama) 4 avril, 2025 directement dans GPT-5. Cette stratégie visait à réduire la confusion des utilisateurs et à rationaliser la complexité des produits. Openai avait déclaré qu’il voulait créer un système unique qui pourrait remplir toutes les fonctions sans nécessiter de «sélecteur de modèles». Paramètres à faible efficacité et 91,5% en mode à haute efficacité. Sur la référence en mathématiques AIME 2024, il a atteint 96,7%. Il a également bien fonctionné sur GPQA Diamond, un test pour le raisonnement scientifique au niveau du doctorat, avec un score de 87,7%. Ces chiffres placent O3 au-dessus de GPT-4.5 et O3-MinI dans des tâches techniques spécifiques, en particulier dans les domaines structurés.

Les chercheurs du prix arc ont noté que «cela représente la première fois que nous avons observé un modèle résolvant de nouvelles tâches grâce à une adaptation interne à étape sage», une référence à l’utilisation par l’O3 de la chaîne privée de raisonnement-un mécanisme par le modèle du modèle qui effectue le logique interne avant la production. Cela lui permet de s’attaquer plus efficacement aux problèmes complexes en plusieurs étapes que les modèles antérieurs.

Une autre caractéristique clé est sa capacité à mettre à l’échelle le calcul en fonction de la complexité des tâches. O3 permet aux développeurs d’augmenter la profondeur du raisonnement, mais le compromis est une utilisation abrupte de calcul-jusqu’à 172X plus dans les configurations à haute efficacité. Ces demandes ont été confirmées dans le blog Arc Benchmark et soulèvent des questions sur la faisabilité à grande échelle.

o4-min, bien que non publiées, devrait être un frère plus petit à O3. Sur la base des conventions de dénomination d’OpenAI, il offre probablement des exigences de calcul réduites avec bon nombre des mêmes avantages de raisonnement. L’entreprise n’a pas encore partagé des références publiques ou des spécifications.

Les modèles d’entreprise et les niveaux de monétisation

Les offres de raisonnement d’Openai sont de plus en plus segmentées. Le 20 mars, la société a lancé O1-Pro via l’accès à l’API, ciblant les cas d’utilisation de l’entreprise tels que les pipelines de la technologie juridique et des agents. Le modèle prend en charge jusqu’à 100 000 jetons de sortie et nécessite 5 $ de dépenses antérieures pour débloquer l’accès. Le prix commence à 150 $ par million de jetons d’entrée et 600 $ pour les sorties.

décrites par OpenAI comme un modèle qui utilise plus de calcul pour réfléchir et fournir des réponses cohérentes, il a été introduit via l’API des réponses d’OpenAI, destinées aux applications structurées avec une complexité rapide élevée. Le coût, comme indiqué le 7 mars. Cela montre une divergence dans les modèles commerciaux: Microsoft regroupe les outils de raisonnement d’Openai dans des logiciels plus larges, tandis qu’Openai monétise le raisonnement comme une fonctionnalité premium.

En attendant que GPT-5, l’apprentissage de GPT-4.5

, GPT-5 est toujours dans le pipeline. Altman dit que le modèle arrivera «dans quelques mois», bien qu’aucune date spécifique n’ait été donnée. Lors de son lancement, GPT-5 devrait intégrer le raisonnement et la génération dans un seul système. Cet objectif avait été cité à l’origine dans le plan de février désormais abandonné de se replier O3 dans GPT-5.

Dans l’intervalle, GPT-4.5 reste le modèle le plus compétent d’Openai à usage général. Sortie fin février, GPT-4.5 a élargi la fenêtre de contexte du système à 200 000 jetons et a introduit des améliorations de la compréhension multilingue. Cependant, il sous-performe toujours dans les repères de raisonnement en mathématiques et en sciences par rapport à O3-MinI.

Altman a décrit GPT-4.5 comme «le premier modèle qui a envie de parler à une personne réfléchie», mais a concédé que le modèle n’était pas conçu comme une puissance de raisonnement. OpenAI a admis que des modèles comme O3-MinI ont toujours dépassé le GPT-4.5 dans des domaines à haute rigor tels que le codage et la résolution de problèmes avancés.

En attendant, Google a publié Gemini 2.5 Pro, qui ne dépasse pas le financement, l’infrastructure AI. Le dernier changement de feuille de route d’Openai se déroule parallèlement à des mouvements financiers et d’infrastructures substantiels. Le 1er avril, la société a annoncé un accord d’offre de 40 milliards de dollars dirigé par SoftBank, portant sa valorisation à 300 milliards de dollars. La structure de l’accord-les ventes d’action secondaire, a permis aux premiers employés et investisseurs de retirer tout en augmentant la pression sur OpenAI pour expédier des produits de grande valeur.

Pour soutenir sa feuille de route à long terme, Openai investit dans sa propre pile de calcul. En mars, il a signé un accord de calcul de 11,9 milliards de dollars avec Coreweave et a pris une participation de 350 millions de dollars dans la société. Il continue également le développement de puces AI personnalisées en partenariat avec Broadcom et TSMC, avec les premières conceptions attendues plus tard cette année.

Openai fait partie du projet Stargate soutenu par les États-Unis, une initiative d’infrastructure multi-phases axée sur les centres de données et les capacités de recherche AI ​​dans les États-Unis.

modèle de poids ouvert et poussée de transparence

juste avant le renversement de l’O3, Altman a également annoncé qu’OpenAI préparait la sortie de son premier modèle de langue ouverte depuis GPT-2. Il a décrit le modèle comme «assez capable» et a demandé aux développeurs et aux chercheurs de fournir des commentaires sur la façon d’améliorer son utilité. L’entreprise a précisé que le modèle comprendra des poids pré-formés mais pas des données ou du code de formation.

“[Nous sommes ravis d’en faire un très, très bon modèle!”Altman a écrit. Cette décision intervient au milieu de la demande croissante des développeurs de transparence et en réponse à la concurrence à partir de modèles open source publiés par Meta, Mistral et Deepseek.

OpenAI a également modifié l’interprétabilité. En février, la société a commencé à révéler des traces de raisonnement interne d’O3-MinI, aidant les développeurs et les chercheurs à comprendre comment les modèles arrivent aux réponses. Cette décision reflète une évolution plus large vers l’explication de l’explication dans la famille des modèles de raisonnement de l’entreprise.

Un avenir modulaire pour la feuille de route du modèle d’Openai

Le pivot d’Openai vers la libération de O3 et O4-MinI avant le GPT-5 illustre son approche de plus en plus modulaire du travail du modèle. Au lieu d’attendre des capacités en un seul modèle de frontière globale, Openai publie désormais des outils spécialisés à mesure qu’ils deviennent prêts pour la production.

Le changement est livré avec des compromis. Les utilisateurs sont désormais confrontés à plus de types de modèles, mais chacun est mieux optimisé pour des tâches spécifiques. Les entreprises peuvent adopter des modèles de raisonnement haut de gamme comme O1-Pro, tandis que les développeurs ont accès à des systèmes intermédiaires comme O4-MinI-ou aux versions d’ouverture de poids pour une expérimentation plus transparente.

Bien que cela puisse compliquer la sélection des produits à court terme. Si GPT-5 finira par consolider ces offres-ou être juste une autre branche de l’arbre modèle en expansion de l’entreprise-reste à voir.

Categories: IT Info