OpenAI ha presentato Reinforcement Fine-Tuning (RFT), un nuovo framework progettato per consentire la personalizzazione dei modelli di intelligenza artificiale per applicazioni specifiche del settore. Presentata durante l’evento”12 Days of OpenAI”di OpenAI, RFT consente agli sviluppatori di migliorare le capacità di ragionamento dell’intelligenza artificiale con set di dati specifici del dominio e rubriche di valutazione.

La nuova funzionalità, rivolta a imprese e ricercatori, si allinea con gli sforzi più ampi di OpenAI per colmare il divario tra i modelli di intelligenza artificiale generalizzati e le esigenze del settore specializzato.

Ad accompagnare RFT è il lancio del piano ChatGPT Pro dal primo giorno di”12 giorni di OpenAI”, un abbonamento da $ 200 al mese progettato per i professionisti. Il piano include la modalità o1 Pro, pubblicizzata come l’intelligenza artificiale più affidabile di OpenAI fino ad oggi. Tuttavia, le prime valutazioni della modalità o1 Pro rivelano sia il suo potenziale che i suoi limiti, evidenziando le sfide in corso nel perfezionare i sistemi di intelligenza artificiale avanzati per l’uso pratico.

Che cos’è il Reinforcement Fine Tuning?

Il Reinforcement Fine Tuning è l’ultimo approccio di OpenAI per migliorare i modelli IA addestrandoli con set di dati e sistemi di valutazione forniti dagli sviluppatori. A differenza dell’apprendimento supervisionato tradizionale, che si concentra sulla replica dei risultati desiderati, RFT enfatizza il ragionamento e la risoluzione dei problemi su misura per domini specifici.

Nel suo annuncio, OpenAI ha descritto RRFT come uno strumento che consente alle organizzazioni di addestrare modelli esperti senza richiedere una conoscenza approfondita dell’apprendimento per rinforzo.
 
[contenuto incorporato]

Presto gli adottanti, come Thomson Reuters e Berkeley Lab, hanno già dimostrato la sua utilità, afferma OpenAI. Thomson Reuters ha utilizzato RFT per sviluppare un assistente legale in grado di analizzare testi giuridici complessi, mentre Berkeley Lab lo ha applicato alla ricerca genetica, scoprendo approfondimenti sulle malattie rare.

Basarsi su innovazioni precedenti

RFT e o1 Pro Mode sono le ultime pietre miliari negli sforzi di OpenAI per perfezionare le prestazioni e l’allineamento dell’IA. All’inizio di quest’anno, OpenAI ha introdotto CriticGPT, uno strumento progettato per assistere i formatori umani nella valutazione dei risultati generati dall’intelligenza artificiale.

CriticGPT è stato particolarmente efficace nelle revisioni del codice, identificando errori che gli annotatori umani spesso trascurano. Combinando l’esperienza umana con la valutazione dell’intelligenza artificiale, OpenAI mira a migliorare l’affidabilità dei suoi modelli.

Concorrenti come Microsoft stanno anche facendo avanzare metodologie di formazione sull’intelligenza artificiale. I Self-Exploring Language Models (SELM) di Microsoft sfruttano le funzioni di ricompensa per migliorare le capacità di seguire le istruzioni.

L’anticipazione di GPT-4.5

Come”12″di OpenAI La campagna Days of OpenAI”continua, crescono le speculazioni su GPT-4.5. Il debutto è previsto per la fine di questo mese, si dice che GPT-4.5 offra ragionamento migliorato, capacità multimodali ampliate e generazione migliorata del linguaggio creativo Gli osservatori del settore lo vedono come una potenziale soluzione ai limiti della modalità o1 Pro, in particolare nelle attività che richiedono adattabilità e astrazione.

Philip, lo sviluppatore del rispettato benchmark SimpleBench, ha commentato il potenziale di GPT.-4.5, affermando:”Non è possibile giustificare $ 200 al mese solo per la modalità Pro.”L’aggiunta di GPT-4.5 potrebbe ridefinire la proposta di valore del piano ChatGPT Pro, affrontando le attuali carenze ed espandendo il suo appeal a un pubblico più ampio.

L’introduzione di RFT e o1 Pro Mode segna un passo avanti nell’approccio di OpenAI missione di allineare le capacità dell’intelligenza artificiale alle richieste del mondo reale. Sebbene questi strumenti siano promettenti in applicazioni specializzate.

Categories: IT Info