Seguendo il turbolento lancio del suo modello GPT-5, Openi sta testando una nuova funzionalità di”pensiero”per GHATGPT che offre agli utenti un controllo più granulare sulle prestazioni dell’intelligenza artificiale. Incarico a fine agosto, l’impostazione sperimentale consente agli utenti di scegliere tra quattro livelli di intensità computazionale.

Questa mossa è una risposta diretta alle critiche diffuse che hanno guastato il lancio di GPT-5, che ha spinto l’azienda a ripristinare il suo popolare modello GPT-4O e controlli manuali aggiuntivi. Consentendo agli utenti di bilanciare la velocità di risposta rispetto alla profondità analitica, Openi mira ad affrontare i problemi di affidabilità e migliorare l’esperienza dell’utente.

Da un lancio disordinato ai controlli manuali

Visione originale di Openi per GPT-5, lanciato il 7 agosto, è stato un sistema unificato che ha selezionato automaticamente il miglior modello interno per un tranquillo.. L’obiettivo era eliminare ciò che il CEO Sam Altman aveva definito un”casino confuso”di diversi modelli. Tuttavia, la strategia ambiziosa si è rapidamente svelata.

Gli utenti hanno documentato una cascata documentata per bug bizzarri ed errori di fatturazione. Il modello ha inventato nomi di stato di fantasia come”Onegon”, fallito in matematica di base e ha prodotto output senza senso, portando a un retro diffuso. L’accoglienza pubblica è stata così negativa che la società è stata costretta a una rara posizione difensiva.

Entro l’8 agosto, Altman ha emesso scuse pubbliche. Ha ammesso che”un”autoswitcher”difettoso tra le modalità interne del modello lo aveva reso per un tempo più lungo”sembra più stupido”del previsto,”incolpare un difetto tecnico per le scarse prestazioni. Questo inciampare ha fornito munizioni per i critici e ha creato un’apertura per i rivali, che hanno rapidamente capitalizzato la situazione.

Pochi giorni dopo, il 12 agosto, Open ha eseguito una significativa reversione. Ha ripristinato GPT-4O per pagare gli abbonati e introdotto modalità manuali per GPT-5:”Auto”,”Fast”e”Thinking”. Questo perno ha segnalato un’importante lezione per il leader dell’intelligenza artificiale sul bilanciamento dell’innovazione con le aspettative degli utenti.

La nuova funzione di”sforzo di pensiero”sembra essere un’evoluzione più granulare di quella correzione del corso. Altman himself hinted at this shift, stating, “one learning for us from the past few days is we really just need to get to a world with more per-user customization of model personality.”

OpenAI’s VP of ChatGPT, Nick Turley, acknowledged the iterative process, noting, “we’re not always going to get everything on try #1 but I am very proud of how quickly the team can iterate,”framing the changes as a rapid response to user Feedback.

Under the Hood: come funziona lo”sforzo di pensiero”

Il nuovo sforzo Picer dà agli utenti un’influenza diretta sul budget computazionale del modello. Secondo i rapporti, la funzionalità presenta quattro livelli distinti di intensità per gli utenti da scegliere. Queste sono”Light”,”Standard”,”Extended”e”Max.”

La versione dell’app Web di New Chatgpt ha un picker di pensiero di pensiero aggiornato (nascosto)-Max Thinking (200), pensiero esteso (48), pensiero standard (18), Light Thinking (5)

e pochi esperimenti correlati, incluso le modelli in più, mostrando il modello selezionato in… a… a seconda di… a… 2. href=”https://t.co/onwcbq4cuw”target=”_ blank”> pic.twitter.com/onwcbq4cuw

-tibor blaho (@btibor91) August 29, 2025

Each level corresponds to an internal “juice”budget, which dictates how many processing Passaggi che il modello fa per formulare una risposta. Più”succo”in genere si traduce in un’analisi più profonda e più attenta, ma aumenta anche i tempi di risposta. Secondo quanto riferito, l’impostazione”massima”più alta è recintata per gli abbonati Pro.

Questo sistema a più livelli consente agli utenti di personalizzare le prestazioni dell’IA a compiti specifici. Un utente potrebbe selezionare”luce”per una domanda rapida e semplice ma passare a”esteso”o”max”quando si lavora su un problema complesso che richiede un ragionamento più approfondito, come una valutazione del legame o un’analisi del codice.

Questo potrebbe essere un accenno di una nuova strategia di prestazione a livelli, aprendo potenzialmente le porte per i modelli di monetizzazione futura oltre un semplice abbonamento. Formalizza il compromesso tra velocità e qualità, una sfida fondamentale nella distribuzione di AI su larga scala.

Una risposta a preoccupazioni più profonde sulla sicurezza dell’IA

Questa spinta per un maggiore controllo degli utenti non riguarda solo il fissaggio di un lancio immerso; Riflette un settore più ampio di resa dei conti con affidabilità e sicurezza dell’intelligenza artificiale. La funzione arriva poco dopo che Openai e rivale Antropic hanno pubblicato i risultati dei test di sicurezza congiunti il ​​28 agosto.

Quelle valutazioni, . I rapporti hanno dettagliato questioni come”la sicofanità estrema”, in cui i modelli convaliderebbero le credenze deliranti di un utente e la volontà di aiutare con richieste pericolose.

I test hanno anche messo in evidenza una divisione filosofica. I modelli antropici si sono spesso rifiutati di rispondere per evitare errori, dando la priorità alla cautela sull’utilità. Al contrario, i modelli di Openai erano più utili ma anche produceva una ricerca significativa per la ricerca o le allucinazioni, nei test controllati, nei test controllati, nei test controllati, nei test controllati, nei test controllati, nei test controllati, nei test controllati .

il debolare GPT-5 GAR GAR GARI Marcus, che ha sostenuto:”Nessuno con integrità intellettuale può ancora credere che il puro ridimensionamento ci porterà a AGI”, mettendo in discussione l’intero paradigma”più grande è meglio”.

Il mio lavoro qui è davvero fatto. Nessuno con integrità intellettuale può ancora credere che il puro ridimensionamento ci porterà ad Agi.

GPT-5 può essere un moderato miglioramento quantitativo (e può essere più economico) ma non riesce ancora allo stesso modo qualitativo dei suoi predecessori, su scacchi, su…

-Gary Marcus (@Garymarcus) 8 agosto 2025

i risultati sembrano anche convalida da parte di jam-openida ha affermato che in azienda”La cultura e i processi di sicurezza hanno preso un sedile posteriore per i prodotti brillanti.”

mettendo il quadrante”pensiero”di pensiero”, Openi li sta autorizzando a mitigare alcuni di questi rischi. La mossa segnala un perno strategico da un approccio automatizzato di”una dimensione”a un’esperienza utente più trasparente, personalizzabile e alla fine più difendibile.

Categories: IT Info