Microsoft zaprezentował dwa nowe wewnętrznie opracowane modele AI, co stanowi znaczący krok w swojej strategii budowania zastrzeżonej sztucznej inteligencji wraz z partnerstwem z Openai. Ogłoszono w czwartek, modele obejmują Mai-Voice-1, wysoce wydajne narzędzie do generowania mowy oraz MAI-1-Preview, pierwszego fundamentalnego modelu tekstowego firmy.
Ten ruch umożliwia Microsoft dywersyfikację portfela AI, zmniejszając jedyną zależność od Openai i wspieranie bardziej odpornego ekosystemu AI dla swoich produktów. Nowe modele sygnalizują ambicję Microsoftu, aby zostać liderem zarówno w zakresie aplikacji AI, jak i podstawowych badań, nadając mu większą kontrolę nad technologiczną mapą drogową.
Inicjatywa jest kierowana przez Microsoft AI (MAI), podział prowadzony przez CEO Mustafę Suleyman. Podkreśla strategiczne obrót w kierunku opracowywania wewnętrznych możliwości, aby uzupełnić swoją wiele miliardów dolarów w Openai.
Firma uważa tę technologię jako fundamentalną dla przyszłości interakcji ludzkich komputerów, stwierdzając, że „głos jest interfejsem przyszłości dla towarzyszy AI”. Mai-Voice-1 został zaprojektowany do realizacji tej wizji poprzez wytwarzanie ekspresyjnego dźwięku odpowiedniego zarówno dla scenariuszy pojedynczych, jak i wielozadaniowych, co jest kluczową zdolnością do tworzenia dynamicznych i interaktywnych doświadczeń AI.
To nie jest jedynie projekt badawczy; Technologia jest już zintegrowana z ofertą produktów Microsoft. Mai-Voice-1 obecnie zasila funkcje w Copilot Daily i podcastach, przynosząc bardziej naturalne i angażujące głosy użytkownikom, którzy codziennie wchodzą w interakcje z tymi usługami.
Aby zaprezentować swój potencjał kreatywny, Microsoft rozpoczął publiczne próba za pośrednictwem nowego narzędzia „Wyrażenia audio” w Copolit Labs. To doświadczenie pozwala każdemu Wklej tekst, wybierz głosy i style oraz pobrać dane wyjściowe . Firma sugeruje użycie przypadków z tworzenia historii „Wybierz własną przygodę” do medytacji z przewodnikiem na zamówienie.
MAI-1-Preview: First Funundational Model firmy Microsoft
Drugi ujawnienie, MAI-1-Preview, stanowi bardziej znaczący strategiczny kamień milowy dla firmy. Microsoft opisuje to jako Pierwszy model fundamentu Trai n całkowicie we własnych laboratoriach. Ten ruch jest kluczowym krokiem w budowaniu niezależnych mięśni rozwojowych sztucznej inteligencji i oferuje to, co firma nazywa „spojrzeniem na przyszłe oferty wewnątrz Copilot.”
Model opiera się na wyrafinowanej architekturze mieszanki ekspertów (MOE), technice znanej z równoważenia ogromnej mocy z wydajnością obliczeniową. Jego rozwój obejmował ogromną inwestycję sprzętową, ponieważ został wstępnie wyszkolony i po wyszkoleniu na klastrze około 15 000 wysoce poszukiwanych GPU H100 w NVIDIA. Firma twierdzi, że model kieruje się specjalizowaniem się w przestrzeganiu instrukcji i udzielaniu pomocnych odpowiedzi na codzienne pytania użytkownika, ustawiając je jako praktyczne i przydatne narzędzie dla szerokiej publiczności.
Aby potwierdzić swoją wydajność, Microsoft realizuje strategię testowania dwutorowego. Otworzył przegląd MAI-1 na publiczną kontrolę Lmareny, popularnej platformy społecznościowej do porównywania wzajemnych modeli AI. To przejrzyste podejście pozwala na bezpośrednie porównanie i obiektywne informacje zwrotne od szerszej społeczności AI.
Jednocześnie model zostanie starannie zintegrowany z flagowym produktem AI Microsoft. W nadchodzących tygodniach zostanie wprowadzony do obsługi niektórych zadań tekstowych w Copilot. Wyznaczonym celem jest uczenie się z informacji zwrotnej użytkowników w celu ulepszenia modelu. Dla programistów i badaczy Microsoft oferuje również ograniczony dostęp do interfejsu API za pośrednictwem procesu aplikacyjnego Zebranie bardziej technicznych spostrzeżeń.
Pomimo tego głównego nacisku na rodzinną sztuczną inteligencję, Microsoft publicznie potwierdza swoje zaangażowanie w Openai. Kierownictwo firmy było jasne, że MAI-1 Preview nie ma na celu zastąpienia potężnych modeli GPT, które obecnie stanowią podstawę wielu jej usług.
CEO Microsoft AI, Mustafa Suleyman, podkreślił tę współpracującą postawę, stwierdzając: „Naszym celem jest pogłębienie partnerstwa i upewnić się, że mamy doskonałą kolaborację z OpenAi dla wielu lat.”. Sugeruje to strategię dywersyfikacji, a nie wymiany, w której Microsoft może wybrać najlepsze narzędzie do dowolnego zadania, czy to od partnera, społeczności typu open source, czy własnych laboratoriów.
[zawartość wbudowana]
To podejście zapewnia strategiczną elastyczność i zabezpieczenia przed nadmiernym relacją na jednego partnera. Oficjalny post na blogu firmy powtórzył ten sentyment, podkreślając misję wywarcia ogromnego pozytywnego wpływu. Zespół Microsoft AI stwierdził: „Mamy również szczęście współpracować z niesamowitymi zespołami produktowymi, dając naszym modele możliwość osiągnięcia miliardów użytkowników i wywarcia ogromnego pozytywnego wpływu.”
Inwestycja w infrastrukturę dodatkowo umacnia tę długoterminową wizję. Microsoft potwierdził, że jego klaster NVIDIA GB200 GBU Nvidia GB200 jest teraz operacyjny, torując drogę dla jeszcze bardziej ambitnych modeli. Suleyman potwierdził poświęcenie firmy, mówiąc: „Mamy ogromną pięcioletnią mapę drogową, którą inwestujemy w kwartał po kwartał. Myślę więc, że to będzie kontynuowane.”
To ogłoszenie ląduje w gwałtownie konkurencyjnym krajobrazie AI. Openai niedawno zaktualizował własne możliwości głosowe za pomocą interfejsu API w czasie rzeczywistym, podczas gdy firmy takie jak antropiczne, Mistral, a nawet Amazon walczą o dominację w szybko rozwijającej się dziedzinie generatywnej sztucznej inteligencji. Ruch Microsoft jest wyraźnym sygnałem, który zamierza konkurować na wszystkich frontach.