Openi ha lanciato ufficialmente la sua famiglia modello GPT-4.1, introducendo tre nuove versioni-GPT-4.1, GPT-4.1 Mini e GPT-4.1 Nano-che mirano a bilanciare le prestazioni di alto livello con costi e velocità flessibili. Costruita per sovraperformare i suoi predecessori, la serie GPT-4.1 migliora le capacità di base come la generazione di codice, il seguito delle istruzioni e il ragionamento a contesto lungo, fornendo una latenza inferiore e un consumo più coerente degli strumenti.
A differenza di GPT-4 e GPT-4O, che alimenta i chatgpt per gli utenti professionisti, i nuovi modelli sono disponibili esclusivamente tramite l’API di Openi, che sottolinea la continua attenzione dell’azienda alle integrazioni aziendali e degli sviluppatori piuttosto che sull’uso di chatbot al consumo.
Il rilascio non è solo un tecnico, ma anche uno spostamento della piattaforma di Openi. Segmentando i nuovi modelli in tre distinti livelli di prestazioni, Openi sta dando agli utenti API la possibilità di ridimensionare in base alla dimensione e al budget del carico di lavoro. Nella parte superiore, il modello GPT-4.1 standard è progettato per le applicazioni più complesse e ha un prezzo di conseguenza: $ 2 per milione di token di input e token di uscita di $ 8 per milione.
>
GPT-4.1 Mini è un’opzione di medio terra, che offre quasi parità nei benchmark di intelligence con latenza molto più bassa, a prezzi di $ 0,40 per milione di token di input e $ 1,60 per milione di output. Per compiti leggeri e casi d’uso in tempo reale, GPT-4.1 Nano è il più efficiente in termini di costi, costando solo $ 0,10 per milione di token di input e $ 0,40 per milione di token di produzione.
Ogni modello è dotato di compromessi di prestazioni, ma Openai afferma che anche il modello più piccolo, nano, outperformi di offerte precedenti come GPT-4o Mini. Queste aggiunte riflettono la crescente enfasi di Openi sul rendere accessibile l’intelligenza artificiale in una più ampia gamma di casi d’uso, da flussi di lavoro agenti ad alte prestazioni agli strumenti incorporati nelle app dei consumatori.
In particolare, tutti e tre i modelli condividono lo stesso taglio delle conoscenze (giugno 2024) e sono stati sintonizzati per fornire output più deterministici, che seguono il formato rispetto alle generazioni precedenti: la mano, riducendo le allucinazioni e migliorano l’affidabilità dell’integrazione negli ambienti di produzione. Solo per la ricerca e la prototipazione, ma per l’implementazione di alto livello in software commerciale, piattaforme SaaS e sistemi di agenti autonomi. Con GPT-4.1 ora posizionato come il successore dell’anteprima GPT-4.5 che sarà presto deviata (che terminano il 14 luglio 2025), Openi sta chiaramente chiarindo che questa generazione dovrebbe trasportare il peso operativo di molti dei suoi partner commerciali. notevoli progressi sui loro predecessori. Il modello GPT-4.1 standard ha ottenuto un punteggio del 54,6% sul Benchmark verificato da SWE-Bench su GPT-4.5.
Nelle istruzioni seguenti, GPT-4.1 ha ottenuto il 38,3% su MultiChallenge Benchmark di Scale , riflettendo un aumento assoluto del 10,5% su GPT-4O.
>
Inoltre, GPT-4.1 ha impostato un nuovo risultato statale di The Art su video-mme di un 6,7%. GPT-4o.
OpenAI ha anche introdotto due versioni aerodinamiche: GPT-4.1 Mini e GPT-4.1 Nano. GPT-4.1 Mini offre latenza e costi ridotti, raggiungendo quasi la metà della latenza e una riduzione dei costi dell’83% rispetto a GPT-4O, mentre corrisponde o superano le prestazioni di GPT-4O nelle valutazioni dell’intelligence.
>
GPT-4.1 Nano, il modello più piccolo e veloce di Openai fino ad oggi, è ottimizzato per le attività che richiedono bassa latenza ed efficienza in termini di costi. Supporta una finestra di contesto fino a 1 milione di token e segna l’80,1% su MMLU, il 50,3% su GPQA e il 9,8% sui benchmark di codifica in poliglotta Aider, superando gli sviluppatori di GPT-4O. Il prezzo per i modelli è il seguente: GPT-4.1 a token di input di $ 2 per milione e token di uscita di $ 8 per milione; GPT-4.1 Mini a $ 0,40 per milione di token di input e $ 1,60 per milione di token di uscita; e GPT-4.1 Nano a $ 0,10 per milione di token di input e $ 0,40 per milione di token di uscita.
Le istruzioni migliorate seguenti e comprensione del contesto lungo
Open si è concentrato sul miglioramento della capacità dei modelli di seguire le istruzioni e comprendere gli input a lungo termine. I modelli GPT-4.1 sono progettati per utilizzare meglio finestre di contesto estese, supportando fino a 1 milione di token ed esibire una migliore comprensione del contesto lungo. Questi miglioramenti rendono i modelli più efficaci per alimentare gli agenti di intelligenza artificiale in grado di compiere compiti in modo indipendente per conto degli utenti, come l’ingegneria del software, l’analisi dei documenti e l’assistenza clienti.
Secondo OpenAI,”Questi miglioramenti nelle istruzioni e la comprensione del contesto a lungo termine. larghezza=”1005″altezza=”605″src=”Dati: immagine/svg+xml; nitro-empty-id=mtc1ntoxmdq3-1; base64, pHn2zyb2awv3qm94psiwidagmtawnsa2md UiiHdpzhropixmda1iibozwlnahq9ijywnsigeg1sbnm9imh0dha6ly93d3cudzmub3jnlziwmdavc3znij48l3n2zz4=”>
Limitazioni e considerazioni del modello
Mentre i modelli GPT-4.1 offrono progressi significativi, Openi riconosce alcune limitazioni. I modelli possono essere più letterali delle versioni precedenti, a volte che richiedono istruzioni più specifiche ed esplicite da parte degli utenti. Inoltre, l’accuratezza dei modelli diminuisce all’aumentare del numero di token di input; Nei test di Openai, l’accuratezza è scesa dall’84% circa con 8.000 token al 50% con 1.024 token.
Openai rileva anche che GPT-4.1 diventa meno affidabile, maggiore è i token di input che deve elaborare, evidenziando l’importanza dell’ingegneria rapida e della gestione del contesto nello sviluppo delle applicazioni. Nel suo incarico ufficiale, la società afferma:”I primi tester hanno osservato che GPT-4.1 può essere più letterale, quindi si consiglia di essere esplicito e specifico nelle istruzioni.”
Inoltre, il modello di anteprima GPT-4.5 sarà deprecato il 14 luglio 2025, lasciando il posto all’adozione più ampia di GPT-4.1. I modelli più recenti hanno un taglio delle conoscenze del giugno 2024, dando agli sviluppatori l’accesso a dati più attuali rispetto alle versioni precedenti.