Microsoft har avduket to nye internt utviklede AI-modeller, og markerer et betydelig skritt i sin strategi for å bygge proprietær AI sammen med sitt partnerskap med Openai. Modellene er kunngjort torsdag, og inkluderer MAI-Voice-1, et meget effektivt taleproduksjonsverktøy og Mai-1-Preview, selskapets første ende-til-ende grunnleggende tekstmodell.

Dette trekket lar Microsoft diversifisere sin AI-portefølje, redusere dets eneste avhengighet av Openai og fremme et mer spenstig eti ecosystamp for sine produkter. De nye modellene signaliserer Microsofts ambisjon om å bli ledende innen både AI-applikasjon og grunnleggende forskning, og gir den større kontroll over det teknologiske veikartet.

Initiativet er spisset av Microsoft AI (MAI), divisjonen ledet av administrerende direktør Mustafa Suleyman. Det understreker en strategisk sving mot å utvikle interne muligheter for å utfylle investeringen på flere milliarder dollar i Openai.

generer et helt minutt med høy troskap lyd under et sekund på en enkeltbegynnelse. Denne ytelsesmetrikken gjør den til et av de mest effektive og”lynraske”talesystemene som er tilgjengelige i dag.

Selskapet ser på denne teknologien som grunnleggende for fremtiden for interaksjon mellom mennesker og datamaskiner, og sier at”stemme er fremtidens grensesnitt for AI-følgesvenner.”MAI-Voice-1 er designet for å levere denne visjonen ved å produsere ekspressiv lyd som er egnet for både enkelt-og multisikerescenarier, en nøkkelfunksjon for å lage dynamiske og interaktive AI-opplevelser.

Dette er ikke bare et forskningsprosjekt; Teknologien er allerede integrert i Microsofts produktoppsett. Mai-Voice-1 driver for tiden funksjoner innen Copilot Daily og podcaster, og gir mer naturlig klingende og engasjerende stemmer til brukere som samhandler med disse tjenestene daglig.

For å vise frem sitt kreative potensial har Microsoft lansert en offentlig prøve via et nytt”Audio Expressions”-verktøy i Copilot Lab. Denne opplevelsen gjør at hvem som helst kan Lim inn tekst, velg stemmer og stiler og last ned output . Selskapet foreslår at brukssaker fra å lage”Velg ditt eget eventyr”-historier til skreddersydde guidede meditasjoner.

Mai-1-Preview: Microsofts første grunnleggende modell

Den andre avsløringen, Mai-1-Preview, representerer en mer betydelig strategisk milepæl for selskapet. Microsoft beskriver det som dets første foundation modell trai n Helt innenfor sine egne laboratorier. Dette trekket er et kritisk skritt i å bygge uavhengig AI-utviklingsmuskel og tilbyr det selskapet kaller et”glimt av fremtidige tilbud i Copilot.”

Modellen er bygget på en sofistikert blanding av ekspertverdier (MOE), en teknikk kjent for balansering enorm kraft med beregningseffektivitet. Utviklingen involverte en massiv maskinvareinvestering, ettersom den var forhåndsutdannet og post-trent på en klynge på omtrent 15 000 av Nvidias svært etterspurte H100 GPU-er.

I følge Microsoft er MAI-1-Preview spesielt designet for å gi kraftige evner for forbrukere. Selskapet hevder at modellen utmerker seg med å spesialisere seg i å følge instruksjoner og gi nyttige svar på spørsmål om hverdagens bruker, og plassere den som et praktisk og nyttig verktøy for et bredt publikum.

For å validere ytelsen, forfølger Microsoft en dobbeltspor-teststrategi. Det har åpnet MAI-1-Preview for offentlig granskning på Lmarena, en populær samfunnsplattform for å benchmarking AI-modeller mot hverandre. Denne gjennomsiktige tilnærmingen muliggjør direkte sammenligning og objektiv tilbakemelding fra det bredere AI-samfunnet.

Samtidig vil modellen bli nøye integrert i Microsofts flaggskip AI-produkt. I løpet av de kommende ukene vil det bli rullet ut for å håndtere visse tekstbaserte oppgaver innen Copilot. Det uttalte målet er å lære av tilbakemeldinger fra brukerne for å forbedre modellen. For utviklere og forskere tilbyr Microsoft også Limited API Access via en søknadsprosess Til tross for dette store presset inn i hjemmelaget AI, bekrefter Microsoft offentlig sin forpliktelse til Openai. Bedriftsledere har vært tydelig på at MAI-1-PReview ikke er ment å erstatte de kraftige GPT-modellene som for øyeblikket underbygger mange av sine tjenester.

Microsoft AI-administrerende direktør Mustafa Suleyman la vekt på denne samarbeidsvillige holdningen, og sier at”vårt mål er å utdype partnerskapet og sørge for at vi har et stort samarbeid med OpenAI for mange, mange år.”Dette antyder en strategi for diversifisering snarere enn erstatning, der Microsoft kan velge det beste verktøyet for en gitt oppgave, enten det er fra en partner, open source-fellesskapet eller dets egne laboratorier.

[innebygd innhold]

Denne tilnærmingen gir strategisk fleksibilitet og hekker mot overindustri på en enkelt partner. Selskapets offisielle blogginnlegg gjentok dette følelsen, og fremhevet et oppdrag for å skape enorm positiv innvirkning. Microsoft AI-teamet uttalte:”Vi er også heldige som samarbeider med utrolige produktteam som gir modellene våre sjansen til å nå milliarder av brukere og skape enorm positiv innvirkning.”

investeringen i infrastruktur styrker ytterligere denne langsiktige visjonen. Microsoft bekreftet at neste generasjons klynge av NVIDIA GB200 GPUer nå er i drift, og baner vei for enda mer ambisiøse modeller. Suleyman bekreftet selskapets engasjement og sa:”Vi har et enormt femårig veikart som vi investerer i kvartal etter kvartal. Så jeg tror det kommer til å fortsette.”

Denne kunngjøringen lander i et voldsomt konkurransedyktig AI-landskap. Openai oppgraderte nylig sine egne stemmefunksjoner med sin sanntids API, mens selskaper som antropisk, Mistral og til og med Amazon alle kjemper om dominans i det raskt utviklende feltet av generativ AI. Microsofts trekk er et klart signal om at den har til hensikt å konkurrere på alle fronter.