A Microsoft új multimodális képességekkel bővíti a Phi-3 AI modellcsaládot

A Microsoft három új modellt vezetett be a Phi-3 kis nyelvi modellek (SLM) családjába: a Phi-3-small és a Phi-3-medium már elérhető, a Phi-3-vision pedig egy új modell. Ezeket a modelleket úgy tervezték, hogy hatékonyak és hatékonyak legyenek, és megfeleljenek a különféle erőforrás-korlátozott környezeteknek, például az eszközön, az élen és az offline következtetési forgatókönyveknek. A Microsoft először a múlt hónapban jelentette be a Phi-3 családot.

Lehetőségek és optimalizálás

A Phi-3 modelleket úgy tervezték, hogy nagy teljesítményt nyújtsanak, ugyanakkor költséghatékonyak legyenek. Olyan környezetekre lettek optimalizálva, ahol a gyors válaszidő elengedhetetlen, így alkalmasak mobileszközökre és más, korlátozott számítási erőforrásokkal rendelkező platformokra. Ez az optimalizálás biztosítja, hogy a modellek hatékonyan működjenek anélkül, hogy túlzott memória-vagy feldolgozási energiát fogyasztanának.

Phi-3-Vision: A multimodális modell

Az újdonságok között kiadások, a Phi-3-Vision kiemelkedik, mint egy multimodális modell, amely képes szöveget és képeket is feldolgozni. Ez a 4,2 milliárd paraméterrel büszkélkedő modell az általános vizuális érvelési feladatokban jeleskedik. A képeket generáló többi mesterséges intelligencia modelltől eltérően a Phi-3 Vision a vizuális adatok megértésére és elemzésére összpontosít, így hasznos lehet például diagramok és grafikonok értelmezésében.

[beágyazott tartalom]

A Microsoft integrálta a Phi-3-mini modellt Azure AI Models-as-a-Service (MaaS) platformja. Ez az integráció lehetővé teszi a felhasználók számára, hogy az Azure infrastruktúráján keresztül különböző alkalmazásokhoz kihasználják a Phi-3-mini képességeit. Ezenkívül a Microsoft továbbfejleszti API-kínálatát a multimodális élmények támogatása érdekében, így sokoldalúbb AI-alkalmazásokat tesz lehetővé.

Új funkciók az Azure AI Speechben

A A Phi-3 modell bejelentései, a Microsoft az Azure AI Speech új funkcióinak előnézetét is bemutatja.. Ezek a funkciók közé tartozik a beszédelemzés és az univerzális fordítás, amelyek célja, hogy segítsenek a fejlesztőknek kiváló minőségű, hangalapú alkalmazások létrehozásában. Ezek a fejlesztések várhatóan robusztusabb eszközöket biztosítanak a beszédfeldolgozáshoz és-elemzéshez.

A Phi-3 családot először áprilisban mutatták be, amikor megjelent a Phi-3-mini, egy 3,8 milliárd paraméterrel rendelkező modell. Az új kiegészítések, a Phi-3-small és a Phi-3-medium 7 milliárd, illetve 14 milliárdos paraméterrel rendelkeznek. Ezeket a modelleket úgy tervezték, hogy kevésbé számításigényesek, így számos eszközhöz alkalmasak, beleértve az okostelefonokat és laptopokat is.

A Microsoft új multimodális képességekkel bővíti a Phi-3 AI modellcsaládot

Published by All Things Windows on May 21, 2024

Lehetőségek és optimalizálás

Phi-3-Vision: A multimodális modell

Új funkciók az Azure AI Speechben

IT Info

A Windows 11 22635.4145 és 27695 build a béta és a Canary csatornákon új funkciókkal

IT Info

Képjelszó hozzáadása a Windowsba való bejelentkezéshez

IT Info

A TPM és a Secure Boot engedélyezése a VMware-en a Windows 11 telepítéséhez

A Microsoft új multimodális képességekkel bővíti a Phi-3 AI modellcsaládot

Published by All Things Windows on May 21, 2024

Lehetőségek és optimalizálás

Phi-3-Vision: A multimodális modell

Új funkciók az Azure AI Speechben

Related Posts

IT Info

A Windows 11 22635.4145 és 27695 build a béta és a Canary csatornákon új funkciókkal

IT Info

Képjelszó hozzáadása a Windowsba való bejelentkezéshez

IT Info

A TPM és a Secure Boot engedélyezése a VMware-en a Windows 11 telepítéséhez