OpenAI ha introdotto Flex Elaboration, un distinto livello di servizio API rivolto agli sviluppatori alla ricerca di modi più economici per utilizzare i modelli di ragionamento O3 e O4-Mini dell’azienda. Annunciata ufficialmente il 17 aprile 2025 e attualmente disponibile in beta, questa opzione riduce significativamente i costi per te-uguali rispetto alle tariffe API standard, rendendo l’IA avanzata potenzialmente più accessibile per determinate applicazioni, sebbene sia fornita con compromessi delle prestazioni.

Questo nuovo livello target appositamente punta aderenti a punti immediati non sono le principali preoccupazioni. documentazione di elaborazione flessibile Punti per utilizzare casi come”valutazioni del modello, arricchimento dei dati e carichi di lavoro asincroni”come candidati ideali. È presentato come una soluzione per lavori a bassa priorità o non di produzione in cui i risparmi sui costi superano la necessità di velocità.

Confrontando il prezzi Flex vs. Standard

Elaborazione Flex riduce i costi per l’interazione con questi modelli a livello esattamente a metà. Per il modello O3, gli sviluppatori che utilizzano Flex pagheranno $ 5 per milione di token di input e $ 20 per milione di token di output, una forte riduzione delle tariffe standard di $ 10 e $ 40, rispettivamente.

Inoltre, Openi avverte esplicitamente di”a href=”https://x.com/btibor91/status/191295820437148062″. non disponibile .”Se il sistema manca di capacità sufficiente quando arriva una richiesta Flex, restituirà un codice di errore HTTP 429. È importante sottolineare che Openai ha confermato che gli sviluppatori non verranno addebitati per richieste che non riescono a questo errore specifico.

Per gestire queste condizioni, OpenIAI suggerisce che gli sviluppatori implementano una corretta gestione degli errori. Per le applicazioni tolleranti ai ritardi, si consiglia di rilasciare la richiesta dopo una pausa-potenzialmente utilizzando la logica di backoff esponenziale. Se è necessario un completamento tempestivo, il ritorno al livello API standard rimane un’opzione.

Gli sviluppatori devono anche anticipare i tempi di risposta più lenti nella loro logica dell’applicazione; Il timeout di 10 minuti predefinito negli SDK ufficiali di Openi potrebbe essere insufficiente e la società suggerisce di aumentare questo timeout a forse 15 minuti per le richieste Flex. Per attivare questo servizio, gli sviluppatori devono specificare il parametro `Service_tier=”Flex”` all’interno delle loro chiamate API.

Contesto: modelli O3/O4-Mini e dinamica di mercato

Questo nuovo livello di pressione si applica specificamente ai modelli lanciati in modo lanciato solo giorni prima, su aprile 1625. I modelli O3 e O3. Introdotto con ragionamento migliorato e ciò che Openi ha definito”comportamento agente precoce”.

Ciò significa che all’interno dell’ambiente CHATGPT interattivo per gli abbonati, questi modelli”ora possono decidere in modo indipendente quali strumenti utilizzare e quando, senza che gli utenti spingono”, selezionando autonomamente capacità come la navigazione web o l’esecuzione del codice. Flex Processing offre un percorso diverso e più conveniente per gli sviluppatori di utilizzare il potere di questi modelli tramite API, adatto alle attività di backend in cui il costo è un driver primario.

La rapida successione del rilascio del modello e questo nuovo livello di prezzi arriva in un ambiente competitivo. Sii aperto di Openi per fornire agli sviluppatori un maggiore controllo granulare rispetto alle prestazioni rispetto alle prestazioni. Questo lancio segue anche altre recenti versioni focalizzate sugli sviluppatori da OpenAI, come lo strumento CLI Codice Open-Source, che può anche sfruttare i modelli O3 e O4-Mini.

Requisiti di accesso API

Accesso programmatico a questi nuovi modelli attraverso l’API è soggetto a determinate condizioni basate sugli utilizzo degli sviluppatori. Sebbene O4-Mini sia ampiamente disponibile su più livelli (1-5), il modello O3 più potente richiede generalmente che gli sviluppatori siano in livelli di spesa più elevati (4 o 5).

Tuttavia, Openi consente agli utenti di livelli inferiori (1-3) di ottenere l’accesso API a O3, comprese le capacità correlate come i riassunti di ragionamento e il supporto dello streaming. Ciò è coerente con le politiche dichiarate di Openi volte a garantire l’uso responsabile della piattaforma.

Categories: IT Info