Microsoft heeft twee nieuwe intern ontwikkelde AI-modellen onthuld, wat een belangrijke stap in zijn strategie markeert om eigen AI te bouwen naast zijn samenwerking met OpenAI. Donderdag aangekondigd, de modellen omvatten Mai-Voice-1, een zeer efficiënte tool voor het genereren van spraak, en MAI-1-Preview, het eerste end-to-end-end-to-end fundamentele tekstmodel van het bedrijf.
Met deze beweging kan Microsoft zijn AI-portfolio diversifiëren, waardoor de enige afhankelijkheid van OpenAI wordt verminderd en een meer veerkrachtige ai-ecosyystemen voor zijn producten kan diversifiëren. De nieuwe modellen signaleren de ambitie van Microsoft om een leider te worden in zowel AI-toepassing als fundamenteel onderzoek, waardoor het meer controle krijgt over zijn technologische routekaart.
Het initiatief wordt geleid door Microsoft AI (MAI), de divisie onder leiding van CEO Mustafa Suleyman. It underscores a strategic pivot towards developing in-house capabilities to complement its multi-billion dollar investment in OpenAI.
MAI-Voice-1: A Nieuwe, hyper-efficiënte stem voor Copilot
De eerste van de nieuwe modellen, Mai-Voice-1, is gepositioneerd als een”zeer expressief en natuurlijk”spraakgeneratiesysteem. De officiële aankondiging van Microsoft benadrukt zijn opmerkelijke efficiëntie en beweert dat het een volledige minuut high-fidelity audio kan genereren in onder een tweede op een enkele gpu. Deze prestatiestatistiek maakt het een van de meest efficiënte en”bliksemsnelle”spraaksystemen die vandaag beschikbaar zijn.
Het bedrijf beschouwt deze technologie als fundamenteel voor de toekomst van de interactie tussen mens en computer, waarin staat dat”stem de interface van de toekomst is voor AI-begeleiden.”Mai-Voice-1 is ontworpen om deze visie te leveren door expressieve audio te produceren die geschikt is voor zowel single-als multi-speaker-scenario’s, een belangrijk vermogen voor het creëren van dynamische en interactieve AI-ervaringen.
Dit is niet alleen een onderzoeksproject; De technologie wordt al geïntegreerd in de productopstelling van Microsoft. Mai-Voice-1 voedt momenteel functies binnen Copilot Daily en Podcasts, waardoor meer natuurlijk klinkende en boeiende stemmen voor gebruikers die dagelijks met deze services communiceren.
om zijn creatieve potentieel te laten zien, heeft Microsoft een openbare proef gelanceerd via een nieuwe”Audio Expressions”Tool in Copilot Labs. Met deze ervaring kan iedereen tekst plakken, stemmen en stijlen plakken en de uitvoer plakken. Het bedrijf stelt gebruik van cases voor het creëren van”Kies je eigen avontuur”verhalen tot op maat gemaakte geleide meditaties.
mai-1-preview: Microsoft’s eerste fundamentele model
De tweede onthulling, Mai-1-Preview, vertegenwoordigt een belangrijker strategische mijlpaal voor het bedrijf. Microsoft describes it as its first foundation model trained End-to-end volledig binnen zijn eigen laboratoria. Deze stap is een cruciale stap in het bouwen van onafhankelijke AI-ontwikkelingsspier en biedt wat het bedrijf een”glimp van toekomstige aanbiedingen in Copilot”noemt.”
Het model is gebouwd op een geavanceerde mengsel-van-experts (MOE) architectuur, een techniek die bekend staat om het evenwicht tussen immense kracht met computationele efficiëntie. De ontwikkeling ervan omvatte een enorme hardware-investering, omdat het vooraf was opgeleid en post-getraind op een cluster van ongeveer 15.000 van Nvidia’s zeer gewilde H100 GPU’s.
Volgens Microsoft is Mai-1-Preview specifiek ontworpen om krachtige mogelijkheden voor consumenten te bieden. Het bedrijf beweert dat het model uitblinkt in het specialiseren in de volgende instructies en het geven van nuttige antwoorden op dagelijkse vragen van gebruikers, het positioneren als een praktisch en nuttig hulpmiddel voor een breed publiek.
Om de prestaties te valideren, volgt Microsoft een dual-track teststrategie. Het heeft Mai-1-preview geopend voor publieke controle op Lmarena, een populair community-platform voor het benchmarken van AI-modellen tegen elkaar. Deze transparante aanpak zorgt voor directe vergelijking en onpartijdige feedback van de bredere AI-gemeenschap.
Tegelijkertijd wordt het model zorgvuldig geïntegreerd in het vlaggenschip AI-product van Microsoft. In de komende weken zal het worden uitgerold om bepaalde tekstgebaseerde taken binnen Copilot te verwerken. Het vermelde doel is om te leren van feedback van gebruikers om het model te verbeteren. Voor ontwikkelaars en onderzoekers biedt Microsoft ook beperkte API-toegang via een aanvraagproces meer technische insights.