Ang Microsoft ay nagbukas ng dalawang bagong panloob na mga modelo ng AI, na nagmamarka ng isang makabuluhang hakbang sa diskarte nito upang makabuo ng pagmamay-ari ng AI kasama ang pakikipagtulungan nito sa OpenAI. Inihayag Huwebes, ang mga modelo ay kasama ang Mai-Voice-1, isang mahusay na tool ng henerasyon ng pagsasalita, at MAI-1-PAGPAPAKITA, ang unang end-to-end na text model ng kumpanya. Ang mga bagong modelo ay nag-signal ng ambisyon ng Microsoft upang maging pinuno sa parehong AI application at foundational research, na binibigyan ito ng higit na kontrol sa teknolohiyang roadmap nito. Binibigyang diin nito ang isang madiskarteng pivot patungo sa pagbuo ng mga kakayahan sa loob ng bahay upang makadagdag sa multi-bilyong dolyar na pamumuhunan sa openai. Ang bago, hyper-mahusay na boses para sa Copilot

Ang opisyal na anunsyo ng Microsoft ay nagtatampok ng kamangha-manghang kahusayan nito, na inaangkin na maaari itong Bumuo ng isang buong minuto ng high-fidelity audio sa ilalim ng isang pangalawang sa isang solong GPU. Ang sukatan ng pagganap na ito ay ginagawang isa sa mga pinaka-mahusay at”kidlat-mabilis”na mga sistema ng pagsasalita na magagamit ngayon. Ang MAI-VOICE-1 ay idinisenyo upang maihatid ang pangitain na ito sa pamamagitan ng paggawa ng nagpapahayag na audio na angkop para sa parehong mga senaryo ng solong at multi-speaker, isang pangunahing kakayahan para sa paglikha ng mga dinamikong at interactive na karanasan sa AI.

Hindi lamang ito isang proyekto ng pananaliksik; Ang teknolohiya ay isinama na sa lineup ng produkto ng Microsoft. Ang MAI-VOICE-1 ay kasalukuyang mga tampok na kapangyarihan sa loob ng Copilot Daily at mga podcast, na nagdadala ng mas natural na tunog at nakakaakit na mga tinig sa mga gumagamit na nakikipag-ugnay sa mga serbisyong ito araw-araw. Ang karanasan na ito ay nagbibigay-daan sa sinuman na i-paste ang teksto, piliin ang mga tinig at estilo, at i-download ang output . Iminumungkahi ng Kumpanya na gumamit ng mga kaso mula sa paglikha ng mga kwento ng”Piliin ang Iyong Sariling Pakikipagsapalaran”upang mag-bespoke na gabay na pagmumuni-muni. Inilarawan ito ng microsoft bilang unang pundasyon ng trai end-to-end buo sa loob ng sarili nitong mga lab. Ang hakbang na ito ay isang kritikal na hakbang sa pagbuo ng independiyenteng kalamnan ng pag-unlad ng AI at nag-aalok ng tinatawag ng kumpanya ng isang”sulyap sa mga handog sa hinaharap sa loob ng copilot.”Ang pag-unlad nito ay kasangkot sa isang napakalaking pamumuhunan sa hardware, dahil ito ay paunang sanay at sinanay sa isang kumpol na humigit-kumulang na 15,000 ng NVIDIA na lubos na hinahangad na H100 GPU. Inaangkin ng Kumpanya ang modelo na higit sa dalubhasa sa pagsunod sa mga tagubilin at pagbibigay ng kapaki-pakinabang na mga tugon sa pang-araw-araw na mga katanungan ng gumagamit, pagpoposisyon nito bilang isang praktikal at kapaki-pakinabang na tool para sa isang malawak na madla. Binuksan nito ang MAI-1-preview sa pampublikong pagsisiyasat sa Lmarena, isang tanyag na platform ng pamayanan para sa benchmarking na mga modelo ng AI laban sa bawat isa. Ang transparent na diskarte na ito ay nagbibigay-daan para sa direktang paghahambing at walang pinapanigan na puna mula sa mas malawak na pamayanan ng AI. Sa mga darating na linggo, ilalabas ito upang hawakan ang ilang mga gawain na batay sa teksto sa loob ng Copilot. Ang nakasaad na layunin ay upang malaman mula sa feedback ng gumagamit upang mapagbuti ang modelo. Para sa mga nag-develop at mananaliksik, nag-aalok din ang Microsoft ng limitadong pag-access sa API sa pamamagitan ng isang proseso ng aplikasyon upang mangalap ng higit pang mga teknikal na pananaw.

Sa kabila ng pangunahing pagtulak sa homegrown AI, ang Microsoft ay muling pinatunayan ang pangako nito sa OpenAi. Ang mga executive ng kumpanya ay malinaw na ang MAI-1-preview ay hindi inilaan upang palitan ang mga makapangyarihang mga modelo ng GPT na kasalukuyang sumasailalim sa marami sa mga serbisyo nito. Ito ay nagmumungkahi ng isang diskarte ng pag-iba-iba sa halip na kapalit, kung saan maaaring pumili ng Microsoft ang pinakamahusay na tool para sa anumang naibigay na gawain, mula sa isang kasosyo, ang open-source na komunidad, o ang sariling mga lab. Ang opisyal na post ng blog ng kumpanya ay nagbigkas ng damdamin na ito, na nagtatampok ng isang misyon upang lumikha ng napakalaking positibong epekto. Sinabi ng koponan ng Microsoft AI,”Masuwerte rin kami sa pakikipagtulungan sa mga hindi kapani-paniwalang mga koponan ng produkto na nagbibigay sa aming mga modelo ng pagkakataon na maabot ang bilyun-bilyong mga gumagamit at lumikha ng napakalaking positibong epekto.”Kinumpirma ng Microsoft na ang susunod na henerasyon na kumpol ng NVIDIA GB200 GPUs ay nagpapatakbo na ngayon, na naglalagay ng paraan para sa mas mapaghangad na mga modelo. Kinumpirma ni Suleyman ang pagtatalaga ng kumpanya, na nagsasabing,”Mayroon kaming napakalaking limang taong roadmap na namumuhunan kami sa quarter pagkatapos ng quarter. Kaya sa palagay ko ay magpapatuloy ito.”Kamakailan lamang ay na-upgrade ng Openai ang sarili nitong mga kakayahan sa boses na may realtime API, habang ang mga kumpanya tulad ng Anthropic, Mistral, at kahit na ang Amazon ay lahat ay naninindigan para sa pangingibabaw sa mabilis na umuusbong na larangan ng pagbuo ng AI. Ang paglipat ng Microsoft ay isang malinaw na signal na balak nitong makipagkumpetensya sa lahat ng mga harapan.

Categories: IT Info