Na de turbulente uitrol van zijn GPT-5-model test OpenAI een nieuwe functie”Thinking inspanning”voor Chatgpt die gebruikers meer gedetailleerde controle geeft over de prestaties van de AI. In de eind augustus kan de experimentele setting gebruikers kiezen uit vier niveaus van computationele intensiteit.

Deze stap is een direct antwoord op de wijdverbreide kritiek die de GPT-5-lancering heeft aangetast, die het bedrijf ertoe bracht zijn populaire GPT-4O-model te herstellen en handmatige controles toe te voegen. Door gebruikers de reactiesnelheid tegen analytische diepte te laten in evenwicht brengen, heeft OpenAI de bedoeling om de betrouwbaarheidsproblemen aan te pakken en de gebruikerservaring te verbeteren.

van een rommelige lancering naar handmatige bedieningselementen

Openai’s oorspronkelijke visie voor GPT-5, gelanceerd op 7 augustus, was een uniform systeem dat automatisch het beste interne model voor een query selecteerde. Het doel was om te elimineren welke CEO Sam Altman een”verwarrende puinhoop”van verschillende modellen had genoemd. De ambitieuze strategie ontrafelde echter snel.

gebruikers documenteerden een cascade van bizarre bugs en flentieve feitelijke fouten. Het model vond fictieve statusnamen uit als”OneGon”, faalde bij basistische wiskunde en produceerde onzinnige output, wat leidde tot wijdverbreide terugslag. De openbare receptie was zo negatief dat het bedrijf werd gedwongen in een zeldzame verdedigende houding.

Tegen 8 augustus gaf Altman een openbare verontschuldiging. Hij gaf toe dat”een defecte‘ autoswitcher ’tussen de interne modi van het model het voor een langere tijd had gemaakt‘ lijken veel dommer ’dan bedoeld,”een technische fout de schuld geven voor de slechte prestaties. Dit struikelen zorgde voor munitie voor critici en creëerde een opening voor rivalen, die snel in gebruik waren op de situatie.

Slechts enkele dagen later, op 12 augustus, voerde Openai een aanzienlijke omkering uit. Het herstelde GPT-4O voor het betalen van abonnees en introduceerde handmatige modi voor GPT-5:”Auto”,”Fast”en”Thinking”. Dit scharnier gaf een belangrijke les voor de AI-leider over het in evenwicht brengen van innovatie met gebruikersverwachtingen.

De nieuwe functie”denkinspanning”lijkt een meer gedetailleerde evolutie van die cursuscorrectie te zijn. Altman zelf liet doorschemeren in deze verschuiving en verklaarde:”Een leren voor ons van de afgelopen dagen is dat we echt gewoon naar een wereld moeten gaan met meer aanpassing per gebruiker van modelpersoonlijkheid.”

Openai’s VP van Chatgpt, Nick Turley, erkende het iteratieve proces,”we zijn niet altijd Feedback van gebruikers.

Onder de motorkap: hoe ‘denkinspanning’ werkt

De nieuwe inspanningskiezer geeft gebruikers directe invloed op het computationele budget van het model. Volgens rapporten presenteert de functie vier verschillende niveaus van intensiteit voor gebruikers om uit te kiezen. Dit zijn”Light”,”Standard”,”Extended”en”Max”. href=”https://t.co/onwcbq4cuw”target=”_ blank”> pic.twitter.com/onwcbq4cuw

-Tibor Blaho (@btibor91) August 29, 2025

Each level corresponds to an internal “juice”budget, which dictates how many processing Stappen die het model nodig heeft om een ​​reactie te formuleren. Meer”sap”resulteert meestal in een diepere, meer zorgvuldige analyse, maar verhoogt ook de responstijd. De hoogste”max”-instelling is naar verluidt gated voor pro-abonnees.

Met dit gelaagde systeem kan gebruikers de prestaties van de AI aanpassen aan specifieke taken. Een gebruiker kan”licht”selecteren voor een snelle, eenvoudige vraag, maar overschakelen naar”uitgebreide”of”max”bij het werken aan een complex probleem dat grondiger redeneren vereist, zoals obligatiewaardering of code-analyse.

Dit kan een hint zijn van een nieuwe districtenprestatiestrategie, mogelijk deuren voor toekomstige monetisatiemodellen buiten een eenvoudig abonnement. Het formaliseert de afweging tussen snelheid en kwaliteit, een kernuitdaging bij grootschalige AI-implementatie.

Een reactie op diepere zorgen over AI Safety

Deze duwtje voor een grotere gebruikerscontrole gaat niet alleen over het oplossen van een lancering van een verknipte; Het weerspiegelt een bredere industrie die rekening houdt met AI-betrouwbaarheid en veiligheid. De functie arriveert kort nadat OpenAI en rivaal Anthropic de resultaten van gezamenlijke veiligheidstests op 28 augustus hebben gepubliceerd.

Die evaluaties, . De rapporten gedetailleerde kwesties zoals”Extreme Sycophancy”, waar modellen de waanovertuigingen van een gebruiker zouden valideren en een bereidheid om te helpen met gevaarlijke verzoeken.

De tests benadrukten ook een filosofische kloof. De modellen van Anthropic weigerden vaak te antwoorden om fouten te voorkomen, waardoor voorzichtigheid wordt gebracht boven nut. De modellen van OpenAI waren daarentegen nuttiger, maar ook Geproduceerd aanzienlijk meer feitelijke fouten of hallucinaties, in de gecontroleerde tests

de GPT-5 debacle voor critics voor critics. Marcus, die betoogde:”Niemand met intellectuele integriteit kan nog steeds geloven dat pure schaling ons naar Agi zal brengen”, waarbij het hele”groter is beter”paradigma.

Mijn werk hier is echt klaar. Niemand met een intellectuele integriteit kan nog steeds geloven dat pure schaling ons naar Agi zal brengen.

GPT-5 kan een gematigde kwantitatieve verbetering zijn (en het kan goedkoper zijn) maar het faalt nog steeds op dezelfde kwalitatieve manieren als zijn voorgangers, op schaken, op…

-Gary Marcus (@garymarcus) href=”https://twitter.com/GaryMarcus/status/1953939152594252170?ref_src=twsrc%5Etfw” target=”_blank”>August 8, 2025

The results also seem to validate warnings from former OpenAI safety lead Jan Leike, who beweerde dat bij het bedrijf:”Veiligheidscultuur en processen hebben een achterbank genomen voor glanzende producten.”

Door de wijzerplaat”denkinspanning”rechtstreeks in handen van gebruikers te plaatsen, staat Openai hen in staat om sommige van deze risico’s te verminderen. De verplaatsing duidt op een strategische pivot van een”one-size-fits-all”geautomatiseerde benadering van een meer transparante, aanpasbare en uiteindelijk meer verdedigbare gebruikerservaring.

Categories: IT Info