A Microsoft három új modellt vezetett be a Phi-3 kis nyelvi modellek (SLM) családjába: a Phi-3-small és a Phi-3-medium már elérhető, a Phi-3-vision pedig egy új modell. Ezeket a modelleket úgy tervezték, hogy hatékonyak és hatékonyak legyenek, és megfeleljenek a különféle erőforrás-korlátozott környezeteknek, például az eszközön, az élen és az offline következtetési forgatókönyveknek. A Microsoft először a múlt hónapban jelentette be a Phi-3 családot.
Lehetőségek és optimalizálás
A Phi-3 modelleket úgy tervezték, hogy nagy teljesítményt nyújtsanak, ugyanakkor költséghatékonyak legyenek. Olyan környezetekre lettek optimalizálva, ahol a gyors válaszidő elengedhetetlen, így alkalmasak mobileszközökre és más, korlátozott számítási erőforrásokkal rendelkező platformokra. Ez az optimalizálás biztosítja, hogy a modellek hatékonyan működjenek anélkül, hogy túlzott memória-vagy feldolgozási energiát fogyasztanának.
Phi-3-Vision: A multimodális modell
Az újdonságok között kiadások, a Phi-3-Vision kiemelkedik, mint egy multimodális modell, amely képes szöveget és képeket is feldolgozni. Ez a 4,2 milliárd paraméterrel büszkélkedő modell az általános vizuális érvelési feladatokban jeleskedik. A képeket generáló többi mesterséges intelligencia modelltől eltérően a Phi-3 Vision a vizuális adatok megértésére és elemzésére összpontosít, így hasznos lehet például diagramok és grafikonok értelmezésében.
[beágyazott tartalom]
A Microsoft integrálta a Phi-3-mini modellt Azure AI Models-as-a-Service (MaaS) platformja. Ez az integráció lehetővé teszi a felhasználók számára, hogy az Azure infrastruktúráján keresztül különböző alkalmazásokhoz kihasználják a Phi-3-mini képességeit. Ezenkívül a Microsoft továbbfejleszti API-kínálatát a multimodális élmények támogatása érdekében, így sokoldalúbb AI-alkalmazásokat tesz lehetővé.
Új funkciók az Azure AI Speechben
A A Phi-3 modell bejelentései, a Microsoft az Azure AI Speech új funkcióinak előnézetét is bemutatja.. Ezek a funkciók közé tartozik a beszédelemzés és az univerzális fordítás, amelyek célja, hogy segítsenek a fejlesztőknek kiváló minőségű, hangalapú alkalmazások létrehozásában. Ezek a fejlesztések várhatóan robusztusabb eszközöket biztosítanak a beszédfeldolgozáshoz és-elemzéshez.
A Phi-3 családot először áprilisban mutatták be, amikor megjelent a Phi-3-mini, egy 3,8 milliárd paraméterrel rendelkező modell. Az új kiegészítések, a Phi-3-small és a Phi-3-medium 7 milliárd, illetve 14 milliárdos paraméterrel rendelkeznek. Ezeket a modelleket úgy tervezték, hogy kevésbé számításigényesek, így számos eszközhöz alkalmasak, beleértve az okostelefonokat és laptopokat is.