OpenAI扭轉了2月份取消O3型號的決定,而是宣布它將在未來幾週內推出O3和O4-Mini,並將GPT-5擱置到今年晚些時候。首席執行官薩姆·奧特曼(Sam Altman)在X上的一篇文章中證實了這項更新,他說該公司現在將保持與通用的語言模型分開分開。

“計劃的更改:我們將在幾個星期內發布O3和O4-Mini,可能會在幾個月內,然後在幾個月內進行讀物。聊天/完成模型。”奧特曼寫道。他補充說:“我們對內部O3的性能感到興奮。”

更改計劃:畢竟我們將在幾週內發布O3和O4-Mini,然後在幾個月內完成GPT-5。

有很多理由,但最令人興奮的是,我們將能夠使我們比我們最初更好地使GPT-5變得更好…… href=”https://twitter.com/sama/status/1908167621624856998?ref_src=twsrc%5Etfw” target=”_blank”>April 4, 2025

The reversal comes just weeks after OpenAI announced it would consolidate its offerings by integrating o3’s capabilities直接進入GPT-5。該策略旨在減少用戶混亂和簡化產品複雜性。 Openai曾表示,它想創建一個可以在不需要“型號採摘器”的情況下使用所有功能的單個系統。

O3和O4-Mini:O4-Mini:結構化​​推理,縮放compute

o3的計劃推出與其在openai conchmarks中的效果息息相關。低效率設置和高效模式下的91.5%。在AIME 2024數學基準中,它達到了96.7%。它在GPQA Diamond上也表現良好,這是對博士學位級的科學推理的測試,得分為87.7%。這些數字將O3置於特定技術任務中,尤其是在結構化領域中,將O3放在GPT-4.5和O3米尼上方。

獎項獎獎獎研究人員指出,“這代表了我們首次觀察到模型通過內部階梯化適應來解決新任務的模型”,這是對O3對私人三連鎖理由的使用,該機構是通過該模型來實現的,以實現私人鏈的機制,以實現一定的機制。這使其能夠比早期模型更有效地解決複雜的多步問題。

另一個關鍵功能是其基於任務複雜性進行計算的能力。 O3允許開發人員增加推理深度,但是權衡是陡峭的計算用法-高效配置的較高到172倍。這些需求已在Arc Benchmark博客中得到確認,並提出了有關可行性的問題。

O4-Mini雖然未發行,但預計將是較小的兄弟姐妹。根據OpenAI的命名慣例,它可能會提供減少的計算要求,並具有許多相同的推理優勢。該公司尚未共享公共基准或規格。

企業模型和貨幣化層

OpenAI的推理產品越來越越來越細分。 3月20日,該公司通過API訪問啟動了O1-Pro,以法律技術和代理管道等企業用例為目標。該模型最多支持100,000個輸出令牌,並且需要$ 5的先前支出來解鎖訪問權限。定價起價為每百萬美元的輸入令牌150美元,輸出的價格為600美元。

Openai描述的是一種模型,它使用更多的計算來更加努力地思考並提供更好的答案,它是通過OpenAI的新響應API引入的,該響應是針對具有高度迅速復雜性的結構化應用的新響應API。如3月7日報導的那樣,這表明商業模型的分歧:Microsoft將OpenAI的推理工具捆綁到更廣泛的軟件中,而Openai將推理作為優質功能而將推理貨幣化。

等待GPT-5,從GPT-4.5 4.5

在此期間,GPT-4.5仍然是Openai最強大的通用模型。 GPT-4.5於2月下旬發布,將系統的上下文窗口擴展到200,000個令牌,並在多語言理解方面提出了改進。但是,與O3-Mini相比,它在數學和科學推理基準中的表現仍然不足。

Altman將GPT-4.5描述為“感覺就像是與有思想的人交談的第一個模型”,但承認該模型並不是設計為推理強大的強國。 OpenAI admitted that models like o3-mini still surpassed GPT-4.5 in high-rigor domains such as coding and advanced problem-solving.

Meanwhile, Google has released Gemini 2.5 Pro, which is not topping various benchmarks for AI reasoning models.

Funding, Infrastructure, and Strategic Pressures

OpenAI’s latest路線圖轉移正在與大量的財務和基礎設施轉移一起展開。 4月1日,該公司宣布了由軟銀領導的400億美元投標交易,將其估值推向了3000億美元。交易的結構(主要次要股票銷售)允許早期的員工和投資者兌現,同時增加了Openai的壓力,以運送高價值產品。

支持其長期路線圖,OpenAI正在自己的計算堆棧中進行投資。 3月,它與Coreweave簽署了119億美元的計算協議,並繳納了3.5億美元的股權。 It also continues development of custom AI chips in partnership with Broadcom and TSMC, with early designs expected later this year.

OpenAI is part of the U.S.-backed Stargate Project, a multi-phase infrastructure initiative focused on building data centers and AI research capacity in the U.S. These moves indicate OpenAI’s goal to reduce reliance on Microsoft Azure, while building out its own compute independence.

開放重量模型和透明度推送

就在O3逆轉之前,Altman還宣布OpenAI正在準備以自GPT-2以來的首個開放式語言模型的發布。他將該模型描述為“功能相當能力”,並要求開發人員和研究人員提供有關如何改善其效用的反饋。該公司澄清說,該模型將包括預先訓練的權重,但不包括培訓數據或代碼。奧特曼寫道。這一舉動是在開發人員對透明度的需求不斷增長的情況下,以及響應Meta,Mistral和DeepSeek發行的開源模型的競爭。

OpenAI也做出了更改以提高可解釋性。 2月,該公司開始揭示O3-Mini的內部推理痕跡,以幫助開發人員和研究人員了解模型如何獲得答案。該決定反映了朝著公司推理模型家族的解釋性的更廣泛的轉變。

OpenAI的模型Roadmap

OpenAI的模塊化未來是釋放O3和O4-Mini在GPT-5之前釋放GPT-5之前的競爭力,這說明了其越來越多的模型部署方法。 Openai現在沒有等待將功能捆綁到一個全面的邊界模型中,而是在準備生產準備時發布了專業工具。

轉變隨著權衡而帶來了權衡。現在,用戶面臨更多模型類型,但是每個模型類型都可以更好地針對特定任務進行優化。企業可以採用諸如O1-Pro之類的高端推理模型,而開發人員可以訪問O4-Mini(O4-Mini)或開放式版本的中間系統,以進行更透明的實驗。

,雖然這可能會使產品選擇複雜化,但它允許OpenAI更快地推動更新並響應用戶,而無需返回單片供應。 GPT-5是否最終會合併這些產品,或者只是公司擴展的模型樹的另一個分支。

Categories: IT Info