Microsoft a dévoilé deux nouveaux modèles d’IA développés en interne, marquant une étape importante dans sa stratégie pour construire une IA propriétaire parallèlement à son partenariat avec OpenAI. Annoncés jeudi, les modèles incluent Mai-Voice-1, un outil de génération de discours très efficace, et Mai-1-Preview, le premier modèle de texte fondamental de bout en bout de la société.

Cette décision permet à Microsoft de diversifier son portefeuille AI, réduisant sa seule dépendance à l’OpenAI et à l’équipement d’un écosystème AI plus résilient pour ses produits. Les nouveaux modèles signalent l’ambition de Microsoft de devenir un leader à la fois dans l’application de l’IA et la recherche fondamentale, ce qui lui donne un plus grand contrôle sur sa feuille de route technologique.

L’initiative est dirigée par Microsoft AI (MAI), la division dirigée par le PDG Mustafa Suleyman. Il souligne un pivot stratégique vers le développement de capacités internes pour compléter son investissement de plusieurs milliards de dollars dans Openai.

générer une minute complète d’audio à haute finalité en sous une seconde sur un seul GPU. Cette métrique de performance en fait l’un des systèmes vocaux les plus efficaces et les plus «rapides» disponibles aujourd’hui.

La société considère cette technologie comme une base de la base de l’avenir de l’interaction humaine-ordinateur, déclarant que «la voix est l’interface du futur pour les compagnons de l’IA». MAI-VOICE-1 est conçu pour livrer cette vision en produisant un audio expressif adapté aux scénarios uniques et multi-ordres, une capacité clé pour créer des expériences d’IA dynamiques et interactives.

Ce n’est pas simplement un projet de recherche; La technologie est déjà intégrée à la gamme de produits de Microsoft. MAI-VOICE-1 alimente actuellement les fonctionnalités du Copilot Daily et des podcasts, apportant des voix plus naturelles et engageantes aux utilisateurs qui interagissent avec ces services quotidiennement.

pour présenter son potentiel créatif, Microsoft a lancé un essai public via un nouvel outil”Audio Expressions”dans Copilot Labs. Cette expérience permet à quiconque de coller du texte, sélectionnez des voix et des styles, et téléchargez la sortie . Le fait que les cas d’utilisation des cas d’utilisation de la création de «choisissez votre propre aventure» pour des méditations guidées sur mesure.

MAI-1-PREVIEW: Le premier modèle fondamental de Microsoft

la seconde, MAI-1-preview, représente une étape stratégique plus significative pour la société. Microsoft le décrit comme son Access API limité via un processus d’application Pour rassembler plus d’informations techniques.

Cette poussée majeure dans l’IA locale, Microsoft réaffirme publiquement son engagement envers Openai. Les dirigeants de l’entreprise ont été clairs que Mai-1-Preview n’est pas destiné à remplacer les puissants modèles GPT qui sous-tendent actuellement bon nombre de ses services.

Microsoft AI PDG, Mustafa Suleyman, a souligné cette position coopérative, déclarant: «Notre objectif est d’approfondir le partenariat et de nous assurer que nous avons une grande collaboration avec Openai pendant de nombreuses années à venir». Cela suggère une stratégie de diversification plutôt que de remplacement, où Microsoft peut choisir le meilleur outil pour une tâche donnée, que ce soit à partir d’un partenaire, de la communauté open source ou de ses propres laboratoires.

[Contenu intégré]

Cette approche offre une flexibilité stratégique et des couvertures contre la surdiance sur un seul partenaire. Le billet de blog officiel de la société a fait écho à ce sentiment, mettant en évidence une mission pour créer un impact positif immense. L’équipe Microsoft AI a déclaré: «Nous avons également la chance de nous associer à des équipes de produits incroyables donnant à nos modèles la possibilité d’atteindre des milliards d’utilisateurs et de créer un impact positif immense.»

L’investissement dans l’infrastructure solidifie encore cette vision à long terme. Microsoft a confirmé que son groupe de prochaine génération de GPU NVIDIA GB 200 est désormais opérationnelle, ouvrant la voie à des modèles encore plus ambitieux. Suleyman a confirmé le dévouement de l’entreprise, disant:”Nous avons une énorme feuille de route sur cinq ans dans laquelle nous investissons dans le trimestre après trimestre. Je pense donc que cela va continuer.”

Cette annonce atterrit dans un paysage IA farouchement compétitif. OpenAI a récemment amélioré ses propres capacités vocales avec son API en temps réel, tandis que des entreprises comme Anthropic, Mistral et même Amazon se disputent toutes la domination dans le domaine rapide de l’IA génératrice en évolution. Le mouvement de Microsoft est un signal clair qu’il a l’intention de rivaliser sur tous les fronts.

Categories: IT Info