Microsoft ka zbuluar dy modele të reja të zhvilluara brenda vendit, duke shënuar një hap të rëndësishëm në strategjinë e tij për të ndërtuar AI të pronarit së bashku me partneritetin e tij me Openai. Të njoftuara të enjten, modelet përfshijnë MAI-VOICE-1, një mjet shumë efikas të gjenerimit të të folurit dhe MAI-1-Preview, modeli i parë i tekstit themelor në fund në fund të kompanisë. Modelet e reja sinjalizojnë ambicien e Microsoft për t’u bërë një udhëheqës si në aplikimin e AI ashtu edhe në hulumtimin themelor, duke i dhënë asaj kontroll më të madh mbi hartën e tij teknologjike. Ai nënvizon një strumbullar strategjik drejt zhvillimit të aftësive brenda shtëpisë për të plotësuar investimin e tij shumë-miliardë dollarësh në Openai. Zëri i ri, hiper-efikas për Copilot
i pari nga modelet e reja, Mai-Voice-1, pozicionohet si një sistem”shumë ekspresiv dhe natyror”i gjenerimit të të folurit. Njoftimi zyrtar i Microsoft nxjerr në pah efikasitetin e tij të jashtëzakonshëm, duke pretenduar se mundet gjenerojnë një minutë të plotë të audios me besnikëri të lartë në nën një sekondë në një GPU të vetme. Kjo metrikë e performancës e bën atë një nga sistemet më të efektshme dhe”të shpejta të rrufeve”të disponueshme sot. MAI-VOICE-1 është krijuar për të dhënë këtë vizion duke prodhuar audio ekspresive të përshtatshme për skenarët e vetëm dhe me shumë folës, një aftësi kryesore për krijimin e përvojave dinamike dhe interaktive të AI.
Ky nuk është thjesht një projekt hulumtues; Teknologjia tashmë është duke u integruar në formacionin e produkteve të Microsoft. MAI-VOICE-1 aktualisht po fuqizon veçoritë brenda Copilot Daily dhe Podcast, duke sjellë më shumë zëra me tinguj natyralë dhe tërheqës për përdoruesit që bashkëveprojnë me këto shërbime çdo ditë. Kjo përvojë i lejon kujtdo të paste teksti, zgjidhni zëra dhe stile dhe shkarkoni daljen . Kompania sugjeron përdorimin e rasteve nga krijimi i tregimeve”Zgjidhni aventurën tuaj”për të bërë meditime të drejtuara. Microsoft e përshkruan atë si modeli i parë i themelit Trai n tërësisht brenda laboratorëve të vet. Kjo veprim është një hap kritik në ndërtimin e muskujve të pavarur të zhvillimit të AI dhe ofron atë që kompania e quan një”paraqitje të shkurtër të ofertave të ardhshme brenda kopilot.”Zhvillimi i saj përfshinte një investim masiv harduer, pasi ishte i trajnuar para dhe i trajnuar në një grup prej afro 15,000 të GPU-ve të NVIDIA-së shumë të kërkuara nga H100. Kompania pretendon se modeli shkëlqen të specializohet në udhëzimet vijuese dhe të sigurojë përgjigje të dobishme për pyetjet e përditshme të përdoruesve, duke e pozicionuar atë si një mjet praktik dhe të dobishëm për një audiencë të gjerë. Ajo ka hapur MAI-1-Preview për shqyrtimin publik në LMarena, një platformë e njohur e komunitetit për krahasimin e modeleve të AI kundër njëri-tjetrit. Kjo qasje transparente lejon krahasim të drejtpërdrejtë dhe reagime të paanshme nga komuniteti më i gjerë i AI. Gjatë javëve të ardhshme, do të mbështetet për të trajtuar detyra të caktuara të bazuara në tekst brenda Copilot. Qëllimi i deklaruar është të mësoni nga reagimet e përdoruesit për të përmirësuar modelin. Për zhvilluesit dhe studiuesit, Microsoft po ofron gjithashtu Qasja e kufizuar e API përmes një procesi aplikimi Për të mbledhur më shumë depërtime teknike.
Përkundër kësaj shtytje të madhe në Homegrown AI, Microsoft po riafirmon publikisht angazhimin e tij për Openai. Drejtuesit e kompanisë kanë qenë të qartë se MAI-1-Preview nuk ka për qëllim të zëvendësojë modelet e fuqishme të GPT që aktualisht mbështesin shumë nga shërbimet e tij. Kjo sugjeron një strategji të diversifikimit sesa zëvendësimin, ku Microsoft mund të zgjedhë mjetin më të mirë për çdo detyrë të caktuar, qoftë nga një partner, komuniteti me burim të hapur, ose laboratorët e vet. Postimi zyrtar në blog i kompanisë i bëri jehonë këtij ndjenje, duke theksuar një mision për të krijuar një ndikim të madh pozitiv. Ekipi i Microsoft AI deklaroi,”Ne jemi gjithashtu me fat që të jemi partnerë me ekipe të jashtëzakonshme të produkteve duke u dhënë modeleve tona mundësinë për të arritur miliarda përdorues dhe të krijojmë ndikim të jashtëzakonshëm pozitiv.”
Investimi në infrastrukturë forcon më tej këtë vizion afatgjatë. Microsoft konfirmoi që grupi i tij i gjeneratës së ardhshme të GPU-ve NVIDIA GB200 tani është operacionale, duke i hapur rrugën modeleve edhe më ambicioze. Suleyman konfirmoi përkushtimin e kompanisë, duke thënë,”Ne kemi një udhërrëfyes të madh pesë vjeçar që po investojmë në tremujor pas tremujorit. Kështu që unë mendoj se do të vazhdojë.”Openai kohët e fundit azhurnoi aftësitë e veta të zërit me API-në e saj në kohë reale, ndërsa kompani si Antropic, Mistral, dhe madje edhe Amazon janë të gjithë duke u bërë të gjithë për mbizotërim në fushën e evolucionit të shpejtë të AI gjeneruese. Lëvizja e Microsoft është një sinjal i qartë që synon të garojë në të gjitha frontet.