Openai ha pubblicato oggi Harmony, un nuovo e obbligatorio formato di risposta per i suoi nuovi modelli di peso aperto GPT-OSS, cambiando fondamentalmente il modo in cui gli sviluppatori interagiscono con loro. Il nuovo formato fornisce un modello di chat strutturato che separa il ragionamento interno, l’utilizzo dello strumento e le risposte finali in canali distinti.
Ciò offre agli sviluppatori il controllo granulare e rende gli agenti AI complessi di costruzione più trasparenti e affidabili. Per semplificare l’adozione, Openai ha anche lanciato una biblioteca ufficiale di `Openai-Harmony”per Python e Rust, che è ora disponibile su GitHub ed è necessaria per i modelli GPT-OSS per funzionare correttamente.
Il rilascio è intrinsecamente collegato al lancio del GPT-OPS ATTISATCE A CAMPIONE A CAMPIONE ATTENAMENTE ATTENAMENTE ATTENAMENTE COMMUSSIONE A CAMPIONE EFFATTO A CAMPIONE EFFATTO A CAMBIO STAMPETTO A CAMPIONE EFFATTO A CAMBIO STAMPETTI A FATTURA E AFFATTO UNA COMMUSSIONE STAMPETTIS Standard in un mercato sempre più popolato da potenti alternative.
Cos’è OpenAi Harmony e perché è necessario?
L’armonia è un modello di chat , un insieme specifico di regole e token speciali che strutturano la conversazione tra un utente e il modello. Openi afferma che i suoi modelli GPT-OS sono stati addestrati specificamente su questo formato e non funzionerà correttamente senza di essa. Questo rende l’armonia un pezzo fondamentale della sua nuova strategia a peso aperto.
La comunità open source ha a lungo afferrato con un paesaggio frammentato di modelli di chat. Modelli diversi richiedono una formattazione diversa, creando attrito per gli sviluppatori. Mandando l’armonia, Openi applica uno standard unico e unificato per il suo ecosistema, garantendo un comportamento prevedibile e semplificando l’integrazione per tutti coloro che si basano su GPT-OS. Consente al modello di produrre flussi distinti per il ragionamento a catena, i preamboli da calcolo degli strumenti e la risposta finale, fornendo una separazione più pulita delle preoccupazioni per gli sviluppatori che costruiscono flussi di lavoro agenti.
L’architettura: canali, ruoli e controllo del ragionamento
introduce diversi concetti di architettura delle chiavi. Il più significativo è l’uso di tre canali di output distinti: `analisi` per il ragionamento,` commento` per le chiamate degli strumenti e `finale` per la risposta rivolta all’utente. Ciò consente agli sviluppatori di ispezionare il”processo di pensiero”del modello” Senza di essa ingombrano l’output finale. Questo nuovo ruolo può aumentare o addirittura sovrascrivere il prompt del sistema principale, offrendo un potente nuovo livello di controllo per gerarchie di istruzioni complesse. Il ruolo di”Developer”consente istruzioni a strati in grado di modificare il comportamento del modello per un compito specifico senza alterare la persona di base”System”, che è cruciale per agenti adattabili.
Inoltre, gli sviluppatori possono ora gestire esplicitamente lo sforzo computazionale del modello. Un parametro `ragioning_effort` nel messaggio di sistema può essere impostato su` basso`, `medium` o` high`. Ciò consente un compromesso diretto tra qualità della risposta, latenza e costi, consentendo la messa a punto per diverse applicazioni, dai chatbot veloci a compiti analitici profondi.