Microsoft heeft twee nieuwe intern ontwikkelde AI-modellen onthuld, wat een belangrijke stap in zijn strategie markeert om eigen AI te bouwen naast zijn samenwerking met OpenAI. Donderdag aangekondigd, de modellen omvatten Mai-Voice-1, een zeer efficiënte tool voor het genereren van spraak, en MAI-1-Preview, het eerste end-to-end-end-to-end fundamentele tekstmodel van het bedrijf.

Met deze beweging kan Microsoft zijn AI-portfolio diversifiëren, waardoor de enige afhankelijkheid van OpenAI wordt verminderd en een meer veerkrachtige ai-ecosyystemen voor zijn producten kan diversifiëren. De nieuwe modellen signaleren de ambitie van Microsoft om een ​​leider te worden in zowel AI-toepassing als fundamenteel onderzoek, waardoor het meer controle krijgt over zijn technologische routekaart.

Het initiatief wordt geleid door Microsoft AI (MAI), de divisie onder leiding van CEO Mustafa Suleyman. It underscores a strategic pivot towards developing in-house capabilities to complement its multi-billion dollar investment in OpenAI.

MAI-Voice-1: A Nieuwe, hyper-efficiënte stem voor Copilot

De eerste van de nieuwe modellen, Mai-Voice-1, is gepositioneerd als een”zeer expressief en natuurlijk”spraakgeneratiesysteem. De officiële aankondiging van Microsoft benadrukt zijn opmerkelijke efficiëntie en beweert dat het een volledige minuut high-fidelity audio kan genereren in onder een tweede op een enkele gpu. Deze prestatiestatistiek maakt het een van de meest efficiënte en”bliksemsnelle”spraaksystemen die vandaag beschikbaar zijn.

Het bedrijf beschouwt deze technologie als fundamenteel voor de toekomst van de interactie tussen mens en computer, waarin staat dat”stem de interface van de toekomst is voor AI-begeleiden.”Mai-Voice-1 is ontworpen om deze visie te leveren door expressieve audio te produceren die geschikt is voor zowel single-als multi-speaker-scenario’s, een belangrijk vermogen voor het creëren van dynamische en interactieve AI-ervaringen.

Dit is niet alleen een onderzoeksproject; De technologie wordt al geïntegreerd in de productopstelling van Microsoft. Mai-Voice-1 voedt momenteel functies binnen Copilot Daily en Podcasts, waardoor meer natuurlijk klinkende en boeiende stemmen voor gebruikers die dagelijks met deze services communiceren.

om zijn creatieve potentieel te laten zien, heeft Microsoft een openbare proef gelanceerd via een nieuwe”Audio Expressions”Tool in Copilot Labs. Met deze ervaring kan iedereen tekst plakken, stemmen en stijlen plakken en de uitvoer plakken. Het bedrijf stelt gebruik van cases voor het creëren van”Kies je eigen avontuur”verhalen tot op maat gemaakte geleide meditaties.

mai-1-preview: Microsoft’s eerste fundamentele model

De tweede onthulling, Mai-1-Preview, vertegenwoordigt een belangrijker strategische mijlpaal voor het bedrijf. Microsoft describes it as its first foundation model trained End-to-end volledig binnen zijn eigen laboratoria. Deze stap is een cruciale stap in het bouwen van onafhankelijke AI-ontwikkelingsspier en biedt wat het bedrijf een”glimp van toekomstige aanbiedingen in Copilot”noemt.”

Het model is gebouwd op een geavanceerde mengsel-van-experts (MOE) architectuur, een techniek die bekend staat om het evenwicht tussen immense kracht met computationele efficiëntie. De ontwikkeling ervan omvatte een enorme hardware-investering, omdat het vooraf was opgeleid en post-getraind op een cluster van ongeveer 15.000 van Nvidia’s zeer gewilde H100 GPU’s.

Volgens Microsoft is Mai-1-Preview specifiek ontworpen om krachtige mogelijkheden voor consumenten te bieden. Het bedrijf beweert dat het model uitblinkt in het specialiseren in de volgende instructies en het geven van nuttige antwoorden op dagelijkse vragen van gebruikers, het positioneren als een praktisch en nuttig hulpmiddel voor een breed publiek.

Om de prestaties te valideren, volgt Microsoft een dual-track teststrategie. Het heeft Mai-1-preview geopend voor publieke controle op Lmarena, een populair community-platform voor het benchmarken van AI-modellen tegen elkaar. Deze transparante aanpak zorgt voor directe vergelijking en onpartijdige feedback van de bredere AI-gemeenschap.

Tegelijkertijd wordt het model zorgvuldig geïntegreerd in het vlaggenschip AI-product van Microsoft. In de komende weken zal het worden uitgerold om bepaalde tekstgebaseerde taken binnen Copilot te verwerken. Het vermelde doel is om te leren van feedback van gebruikers om het model te verbeteren. Voor ontwikkelaars en onderzoekers biedt Microsoft ook beperkte API-toegang via een aanvraagproces meer technische insights.

a diversified strategie: in evenwicht geslingerd:

Ondanks deze grote duwtje in eigen bodem AI, bevestigt Microsoft publiekelijk zijn toewijding aan Openai. Bedrijfsleiders zijn duidelijk geweest dat MAI-1-Preview niet bedoeld is om de krachtige GPT-modellen te vervangen die momenteel veel van zijn diensten ondersteunen. Dit suggereert een strategie van diversificatie in plaats van vervanging, waarbij Microsoft het beste hulpmiddel voor een bepaalde taak kan kiezen, of deze nu van een partner, de open-source community of zijn eigen laboratoria is.

[ingebedde inhoud]

Deze aanpak biedt strategische flexibiliteit en hedges tegen overbruggingen op een enkele partner. De officiële blogpost van het bedrijf herhaalde dit sentiment en benadrukte een missie om een ​​enorme positieve impact te creëren. Het Microsoft AI-team verklaarde:”We hebben ook het geluk om samen te werken met ongelooflijke productteams die onze modellen de kans geven om miljarden gebruikers te bereiken en een enorme positieve impact te creëren.”

De investering in infrastructuur stolt deze langetermijnvisie verder. Microsoft bevestigde dat het cluster van de volgende generatie van NVIDIA GB200 GPU’s nu operationeel is en de weg vrijmaakt voor nog ambitieuzere modellen. Suleyman bevestigde de toewijding van het bedrijf en zei:”We hebben een enorme routekaart van vijf jaar die we in kwartaal na kwartaal investeren. Dus ik denk dat dat zal doorgaan.”

Deze aankondiging landt in een fel competitief AI-landschap. Openai heeft onlangs zijn eigen spraakmogelijkheden geüpgraded met zijn realtime API, terwijl bedrijven als antropisch, mistral en zelfs Amazon allemaal strijden om dominantie in het snel evoluerende veld van generatieve AI. De beweging van Microsoft is een duidelijk signaal dat het van plan is op alle fronten te concurreren.

Categories: IT Info