Microsoft ha ha introdotto tre nuovi modelli nella famiglia Phi-3 di modelli Small Language (SLM): Phi-3-small e Phi-3-medium sono ora disponibili e Phi-3-vision è un nuovo modello. Questi modelli sono progettati per essere efficienti e potenti e adatti a vari ambienti con risorse limitate, come scenari di inferenza su dispositivo, edge e offline. Microsoft ha inizialmente annunciato la famiglia Phi-3 il mese scorso.

Funzionalità e ottimizzazione

I modelli Phi-3 sono progettati per offrire prestazioni elevate pur essendo convenienti. Sono ottimizzati per ambienti in cui sono essenziali tempi di risposta rapidi, rendendoli adatti a dispositivi mobili e altre piattaforme con risorse computazionali limitate. Questa ottimizzazione garantisce che i modelli possano funzionare in modo efficiente senza consumare memoria o potenza di elaborazione eccessive.

Phi-3-Vision: un modello multimodale

Tra i nuovi versioni, Phi-3-Vision si distingue come un modello multimodale in grado di elaborare sia testo che immagini. Questo modello, che vanta 4,2 miliardi di parametri, eccelle nei compiti generali di ragionamento visivo. A differenza di altri modelli di intelligenza artificiale che generano immagini, Phi-3 Vision si concentra sulla comprensione e sull’analisi dei dati visivi, rendendolo utile per attività come l’interpretazione di diagrammi e grafici.

[contenuto incorporato]

Microsoft ha integrato il modello Phi-3-mini nel suo Piattaforma Models-as-a-Service (MaaS) di Azure AI. Questa integrazione consente agli utenti di sfruttare le funzionalità di Phi-3-mini per varie applicazioni attraverso l’infrastruttura di Azure. Inoltre, Microsoft sta migliorando le proprie offerte API per supportare esperienze multimodali, consentendo applicazioni IA più versatili.

Nuove funzionalità in Azure AI Speech

In concomitanza con Annunciati il ​​modello Phi-3, Microsoft presenta anche in anteprima le nuove funzionalità per Azure AI Speech. Queste funzionalità includono l’analisi vocale e la traduzione universale, volte ad aiutare gli sviluppatori a creare applicazioni vocali di alta qualità. Si prevede che questi miglioramenti forniranno strumenti più robusti per l’elaborazione e l’analisi del parlato.

La famiglia Phi-3 è stata inizialmente introdotta ad aprile con il rilascio di Phi-3-mini, un modello con 3,8 miliardi di parametri. Le nuove aggiunte, Phi-3-small e Phi-3-medium, hanno rispettivamente 7 miliardi e 14 miliardi di parametri. Questi modelli sono progettati per richiedere meno operazioni di elaborazione, il che li rende adatti a un’ampia gamma di dispositivi, inclusi smartphone e laptop.

Categories: IT Info