Il modello AI compatto di Microsoft Phi-4 ora è completamente open source

Microsoft ha reso open source Phi-4, il suo modello linguistico compatto, rilasciando al pubblico tutto il suo peso su Hugging Face con una licenza MIT.

Phi-4, introdotto per la prima volta nel dicembre 2024 attraverso La piattaforma Azure AI Foundry di Microsoft era inizialmente disponibile solo per i ricercatori con una licenza controllata. Con la versione open source, Microsoft fornisce a ricercatori e sviluppatori di tutto il mondo gli strumenti per personalizzare, distribuire e commercializzare il modello compatto ma ad alte prestazioni.

Phi-4: un modello compatto con dimensioni fuori misura Risultati

Phi-4 rappresenta un allontanamento dal tradizionale sviluppo dell’intelligenza artificiale, che ha spesso dato priorità alla scala come parametro principale per le prestazioni. Con soli 14 miliardi di parametri, Phi-4 offre risultati che rivaleggiano e addirittura superano le controparti più grandi, come Gemini Pro 1.5 di Google e GPT-4o di OpenAI.

Fonte: Microsoft

Nei benchmark recenti, Phi-4 ha ottenuto un impressionante 91,8 all’American Mathematics Competition (AMC 12), superando il punteggio di 89,8 di Gemini Pro 1.5 e 77,9 di GPT-4o.

Microsoft ha mostrato le capacità di ragionamento matematico di Phi-4 attraverso un problema combinatorio, in cui il modello ha calcolato accuratamente 431 permutazioni distinte per un’ipotetica razza che coinvolge cinque lumache.

Phi-4 supera modelli molto più ampi, incluso Gemini Pro 1.5, sui problemi di competizione matematica (Fonte: Microsoft)

Questo livello di precisione evidenzia il suo potenziale per i domini che richiedono logica e matematica rigore, come finanza, ingegneria e ricerca scientifica.

Microsoft ha spiegato i suoi obiettivi per Phi-4 nella sua documentazione ufficiale:”Phi-4 continua a spingere la frontiera tra dimensione e qualità”, ha fatto eco un sentimento da ricercatori che hanno confrontato le sue prestazioni con modelli con un numero di parametri cinque volte superiore.

Metodologia di addestramento e dati sintetici

Le basi del successo di Phi-4 sta nella sua formazione approccio Microsoft ha sfruttato set di dati sintetici comprendenti contenuti in stile libro di testo, enfatizzando il ragionamento matematico, la programmazione e la logica del buon senso. Questi set di dati, per un totale di 9,8 trilioni di token, sono stati integrati da documenti pubblici selezionati, testi accademici e dati multilingue.

“Piuttosto che servire come sostituto economico dei dati organici, i dati sintetici offrono vantaggi diretti”, ha osservato Microsoft nella sua relazione tecnica, evidenziando il controllo e l’adattabilità che offre durante l’addestramento del modello. Questo approccio ha anche ridotto la dipendenza dai contenuti web-scraper, spesso criticati per le incoerenze di qualità.

Migliorare il. ragionamento e allineamento del modello, Microsoft ha applicato tecniche avanzate di post-formazione come la messa a punto supervisionata e l’ottimizzazione delle preferenze dirette. Queste metodologie hanno perfezionato la capacità di Phi-4 di distinguere tra output di alta qualità e di bassa qualità, aumentando ulteriormente la sua precisione in settori specifici. applicazioni.

Disponibilità open source

La decisione di rilasciare Phi-4 come open source riflette la più ampia strategia di Microsoft volta a democratizzare gli strumenti di intelligenza artificiale. Gli sviluppatori possono ora accedere al modello su Hugging Face, dove i suoi pesi completi sono disponibili con licenza MIT. Shital Shah, un ingegnere principale di Microsoft, ha annunciato il rilascio su X (ex Twitter), scrivendo:”Molte persone ci avevano chiesto un rilascio di peso… Beh, non aspettare oltre.”

Siamo rimasti completamente stupiti dalla risposta al rilascio del phi-4. Molte persone ci hanno chiesto il rilascio dei pesi. Pochi hanno addirittura caricato pesi phi-4 bootleg su HuggingFace😬.

Bene, aspetta. Di più. Rilasciamo oggi il modello ufficiale phi-4 su HuggingFace!

Con licenza MIT pic.twitter.com/rcugWBPU4r

— Shital Shah (@sytelus) 8 gennaio 2025

La versione open source consente agli sviluppatori di personalizzare Phi-4 per applicazioni specifiche senza il sovraccarico computazionale tipicamente associato ai modelli più grandi. La sua architettura densa, composta solo da decodificatore, una variante del modello del trasformatore, riduce al minimo i requisiti in termini di risorse, rendendolo accessibile anche alle organizzazioni con infrastrutture limitate.

Considerazioni etiche e impatti sul settore

Il lancio di Phi-4 da parte di Microsoft evidenzia il suo impegno verso diffusione responsabile dell’IA. La piattaforma Azure AI Foundry, che inizialmente ospitava Phi-4, incorpora misure di sicurezza come il filtraggio dei contenuti e test contraddittori. Queste misure sono progettate per mitigare rischi come pregiudizi, disinformazione e generazione di contenuti dannosi.

Rilasciando Phi-4 con una licenza open source, Microsoft risponde anche alla crescente domanda di trasparenza nello sviluppo dell’intelligenza artificiale. La mossa è in linea con le tendenze del settore osservate in versioni come Llama 3.2 di Meta e la serie Gemma di Google, sebbene le prestazioni eccezionali di Phi-4 nei benchmark stabiliscano un nuovo standard per i modelli compatti.

Phi-4 sfida il presupposto che i modelli più grandi sono intrinsecamente migliori. Il suo design compatto non solo riduce i costi computazionali ed energetici, ma amplia anche l’accesso alle funzionalità IA avanzate. Questa efficienza è particolarmente preziosa per le organizzazioni di medie dimensioni e i ricercatori che non dispongono delle risorse per implementare modelli di grandi dimensioni.

Mentre l’intelligenza artificiale continua a evolversi, Phi-4 offre uno sguardo su un futuro in cui modelli più piccoli e più intelligenti potranno incontrarsi le esigenze di attività specializzate senza compromettere le prestazioni.

Il modello AI compatto di Microsoft Phi-4 ora è completamente open source

Published by All Things Windows on January 9, 2025

Phi-4: un modello compatto con dimensioni fuori misura Risultati

Metodologia di addestramento e dati sintetici

Disponibilità open source

Considerazioni etiche e impatti sul settore

IT Info

La botnet globale Mirai “Gayfemboy” sfrutta dispositivi IoT e router industriali a livello globale

IT Info

Grok AI espande l’ecosistema xAI con il lancio dell’app iOS

IT Info

Amazon AWS investe 11 miliardi di dollari nell’espansione del data center AI della Georgia

Il modello AI compatto di Microsoft Phi-4 ora è completamente open source

Published by All Things Windows on January 9, 2025

Phi-4: un modello compatto con dimensioni fuori misura Risultati

Metodologia di addestramento e dati sintetici

Disponibilità open source

Considerazioni etiche e impatti sul settore

Related Posts

IT Info

La botnet globale Mirai “Gayfemboy” sfrutta dispositivi IoT e router industriali a livello globale

IT Info

Grok AI espande l’ecosistema xAI con il lancio dell’app iOS

IT Info

Amazon AWS investe 11 miliardi di dollari nell’espansione del data center AI della Georgia