OpenAI har vänt sitt beslut i februari att avbryta O3-modellen och tillkännagav istället att den kommer att lansera O3 och O4-Mini under de kommande veckorna-att sätta GPT-5 på vent fram till senare i år. Uppdateringen bekräftades av VD Sam Altman i ett inlägg på X, där han sa att företaget nu kommer att hålla resonemangsmodeller åtskilda från sina allmänna språkmodeller.

“Förändring av planer: Vi kommer att släppa O3 och O4-mini trots allt, det är förmodligen i ett par veckor, och sedan gör GPT-5 på några månader. Det finns en egen anledningar för detta, men det är troligt att de är på ett par veckor, och sedan gör GPT-5 på några månader. Det finns en man för detta, men men det är troligtvis på ett par veckor, och sedan gör GPT-5 på några månader. Det finns en man för detta, men de mest exponering är det, och det är förmodligen i ett par veckor, och sedan gör GPT-5 på några månader. Det finns en egen anledningar för detta, men det är troligtvis på ett par veckor, och sedan gör GPT-5 i några månader. Modeller för chatt/slutförande.”Altman skrev. Han tillade,”Vi är glada över den prestanda vi ser från O3 internt.”

förändring av planer: Vi kommer att släppa O3 och O4-mini trots allt, förmodligen om ett par veckor, och sedan gör GPT-5 på några månader.

Det finns en massa orsaker till detta, men det mest spännande är att vi kommer att kunna göra gpt-5 mycket bättre än vi ursprungligen…

— SAM (@SAMA) < href="https://twitter.com/sama/status/1908167621624856998?ref_src=twsrc%5Etfw" target="_blank">April 4, 2025

The reversal comes just weeks after OpenAI announced it would consolidate its offerings by integrating o3’s capabilities direkt till GPT-5. Denna strategi syftade till att minska användarförvirringen och effektivisera produktkomplexiteten. OpenAI hade sagt att det ville skapa ett enda system som kunde tjäna alla funktioner utan att kräva en”modellväljare.”

o3 och O4-mini: Strukturerad resonemang, skalad dator

O3: s planerade utrullning är bunden till sin prestanda i resonemang bänkmaskiner, som OpenAi-förekomst i december 2024. Inställningar med låg effektivitet och 91,5% i högeffektivitetsläge. På AIME 2024 MATEMATICS-riktmärket nådde den 96,7%. Det presterade också bra på GPQA Diamond, ett test för vetenskapsnivå för doktorandnivå, med en poäng på 87,7%. Dessa siffror placerar O3 ovanför GPT-4,5 och O3-mini i specifika tekniska uppgifter, särskilt inom strukturerade domäner.

ARC-prisforskare noterade att”detta representerar första gången vi har observerat en modell som löser nya uppgifter genom intern stegvis anpassning”, en hänvisning till O3: s användning av privata kedja-resonemang-en mekanism genom vilken modellinförande före leverans av en inmatning. Detta gör att det kan hantera komplexa flerstegsproblem mer effektivt än tidigare modeller.

En annan nyckelfunktion är dess förmåga att skala beräkna baserat på uppgiftskomplexitet. O3 gör det möjligt för utvecklare att öka resonemangsdjupet, men avvägningen är brant datoranvändning-upp till 172 gånger mer i högeffektiva konfigurationer. Dessa krav bekräftades i ARC Benchmark-bloggen och ställer frågor om genomförbarhet i skala.

o4-mini, även om de inte är utgivna, förväntas vara en mindre syskon till O3. Baserat på Openais namnkonventioner erbjuder det troligtvis minskade beräkningskrav med många av samma resonemang. Företaget har ännu inte delat offentliga riktmärken eller specifikationer.

företagsmodeller och intäktsgränser

openais resonemang är alltmer segmenterade. Den 20 mars lanserade företaget O1-Pro via API-åtkomst och inriktade sig på företag som använder juridiska teknik-och agentledningar. Modellen stöder upp till 100 000 utgångstokens och kräver $ 5 i tidigare utgifter för att låsa upp åtkomst. Pricing starts at $150 per million input tokens and $600 for outputs.

Described by OpenAI as a model that uses more compute to think harder and provide consistently better answers, it was introduced via OpenAI’s new Responses API, intended for structured applications with high prompt complexity.

At the other end of the spectrum, Microsoft has integrated OpenAI’s o3-mini-High model into Copilot at no Kostnad, som rapporterats den 7 mars. Detta visar en divergens i affärsmodeller: Microsoft buntar OpenAI: s resonemangsverktyg till bredare programvara, medan OpenAI tjänar pengar på resonemang som en premiumfunktion.

som väntar på GPT-5, lärande från GPT-4,5

så, GPT-5 är stilla i pipelinjen. Altman säger att modellen kommer att anlända”om några månader”, även om inget specifikt datum har givits. När den lanseras förväntas GPT-5 integrera resonemang och generation i ett system. Det målet hade ursprungligen citerats i den nu övergivna februariplanen för att fälla O3 till GPT-5.

Under tiden förblir GPT-4,5 OpenAI: s mest kapabla allmänna modell. Släppt i slutet av februari utvidgade GPT-4,5 systemets sammanhangsfönster till 200 000 tokens och introducerade förbättringar i flerspråkig förståelse. Men det underpresterar fortfarande i matematik och vetenskapliga resonemang jämfört med O3-mini.

Altman beskrev GPT-4.5 som”den första modellen som känns som att prata med en tankeväckande person”, men medgav att modellen inte var utformad som ett resonemang. OpenAI medgav att modeller som O3-Mini fortfarande överträffade GPT-4,5 inom hög rigor-domäner som kodning och avancerad problemlösning.

Under tiden har Google släppt Gemini 2.5 Pro, som inte toppar olika benchmarks för AI-resonemangsmodeller.

Openais senaste färdplanskift utvecklas tillsammans med betydande finansiella och infrastrukturrörelser. Den 1 april tillkännagav företaget en anbudsavtal på 40 miljarder dollar under ledning av SoftBank och pressade sin värdering till 300 miljarder dollar. Strukturen i affären-främst sekundär aktieförsäljning-tillät tidiga anställda och investerare att utbetala medan de ökar trycket på OpenAI för att skicka högvärdesprodukter.

För att stödja sin långsiktiga färdplan investerar OpenAI i sin egen beräkningsstack. I mars tecknade det ett beräkningsavtal med 11,9 miljarder dollar med CoreWeave och tog en aktieandel på 350 miljoner dollar i företaget. Det fortsätter också utvecklingen av anpassade AI-chips i samarbete med Broadcom och TSMC, med tidiga mönster som förväntas senare i år.

openai är en del av det amerikanska stödet Stargate-projektet, ett multifasinfrastrukturinitiativ fokuserat på att bygga datacenter och AI-forskningskapacitet i USA. Dessa rörelser indikerar OpenAI: s mål till Reliance på Reliance på MicroSoft, medan byggande utifrån och bygger ut oberoende.

öppen viktmodell och transparens push

Strax före O3-omvändningen meddelade Altman också att OpenAI förbereder frisläppandet av sin första öppna språkmodell sedan GPT-2. Han beskrev modellen som”ganska kapabel”och bad utvecklare och forskare att ge feedback om hur man kan förbättra dess användbarhet. Företaget klargjorde att modellen kommer att inkludera förutbildade vikter men inte utbilda data eller kod.

“[W] E är glada över att göra detta till en mycket, mycket bra modell!”Altman skrev. Flytten kommer mitt i den växande utvecklarens efterfrågan på öppenhet och som svar på konkurrens från open source-modeller som släppts av Meta, Mistral och Deepseek.

oenai har också gjort förändringar för att öka tolkningen. I februari började företaget avslöja interna resonemang från O3-Mini och hjälpa utvecklare och forskare att förstå hur modeller kommer till svar. Detta beslut återspeglar en bredare förskjutning mot förklarbarhet i företagets resonemangsmodellfamilj.

En modulär framtid för OpenAI: s modell Roadmap

OpenAI: s pivot för att släppa O3 och O4-Mini före GPT-5 illustrerar dess ökande modulära tillvägagångssätt för modellutställning. Istället för att vänta på att buntas kapacitet till en heltäckande gränsmodell, släpper OpenAI nu specialiserade verktyg när de blir produktionsklar.

Skiftet kommer med avvägningar. Användare möter nu fler modelltyper, men var och en är bättre optimerad för specifika uppgifter. Företag kan anta avancerade resonemangsmodeller som O1-Pro, medan utvecklare får tillgång till mellanliggande system som O4-Mini-eller till öppna Weight-versioner för mer transparent experiment. Huruvida GPT-5 så småningom kommer att konsolidera dessa erbjudanden-eller bara vara en annan gren i företagets expanderande modellträd-är att se.

Categories: IT Info