Microsoft a dévoilé deux nouveaux modèles d’IA développés en interne, marquant une étape importante dans sa stratégie pour construire une IA propriétaire parallèlement à son partenariat avec OpenAI. Annoncés jeudi, les modèles incluent Mai-Voice-1, un outil de génération de discours très efficace, et Mai-1-Preview, le premier modèle de texte fondamental de bout en bout de la société.
Cette décision permet à Microsoft de diversifier son portefeuille AI, réduisant sa seule dépendance à l’OpenAI et à l’équipement d’un écosystème AI plus résilient pour ses produits. Les nouveaux modèles signalent l’ambition de Microsoft de devenir un leader à la fois dans l’application de l’IA et la recherche fondamentale, ce qui lui donne un plus grand contrôle sur sa feuille de route technologique.
L’initiative est dirigée par Microsoft AI (MAI), la division dirigée par le PDG Mustafa Suleyman. Il souligne un pivot stratégique vers le développement de capacités internes pour compléter son investissement de plusieurs milliards de dollars dans Openai.
générer une minute complète d’audio à haute finalité en sous une seconde sur un seul GPU. Cette métrique de performance en fait l’un des systèmes vocaux les plus efficaces et les plus «rapides» disponibles aujourd’hui.
La société considère cette technologie comme une base de la base de l’avenir de l’interaction humaine-ordinateur, déclarant que «la voix est l’interface du futur pour les compagnons de l’IA». MAI-VOICE-1 est conçu pour livrer cette vision en produisant un audio expressif adapté aux scénarios uniques et multi-ordres, une capacité clé pour créer des expériences d’IA dynamiques et interactives.
Ce n’est pas simplement un projet de recherche; La technologie est déjà intégrée à la gamme de produits de Microsoft. MAI-VOICE-1 alimente actuellement les fonctionnalités du Copilot Daily et des podcasts, apportant des voix plus naturelles et engageantes aux utilisateurs qui interagissent avec ces services quotidiennement.
pour présenter son potentiel créatif, Microsoft a lancé un essai public via un nouvel outil”Audio Expressions”dans Copilot Labs. Cette expérience permet à quiconque de coller du texte, sélectionnez des voix et des styles, et téléchargez la sortie . Le fait que les cas d’utilisation des cas d’utilisation de la création de «choisissez votre propre aventure» pour des méditations guidées sur mesure.
MAI-1-PREVIEW: Le premier modèle fondamental de Microsoft
la seconde, MAI-1-preview, représente une étape stratégique plus significative pour la société. Microsoft le décrit comme son Access API limité via un processus d’application Pour rassembler plus d’informations techniques.