OpenAI推出了Flex Processing,這是一個獨特的API服務層,旨在開發人員尋求更經濟的方式使用公司的O3和O4-Mini推理模型。該選項於2025年4月17日正式宣布,目前在Beta中宣布,與標準API率相比,該選項大大降低了人均成本,使高級AI在某些應用程序中可能更易於訪問,儘管它伴隨著性能權衡。

此新的Tier tiers特定目標是直接目標,而不是主要問題。 flex處理文檔指出了“模型評估,數據豐富”,“數據豐富”和“異步工作”諸如“理想候選人”的用例。它是用於低優先級或非生產工作的解決方案,在該解決方案中節省的成本優於速度的需求。

比較Flex與標准定價

flex處理可削減與這些模型的交互成本,從而削減成本。對於O3型號,使用Flex的開發人員將為每百萬美元的輸入令牌和20萬美元的產量代幣支付5美元,分別從10美元和40美元的標准率下降。

降低了50%的降低,價格為每百萬美元的投入令牌為0.55美元,而在Flex下的價格為2.20美元,而普通的1.10美元和4.40美元的價格為每百萬美元。這種定價結構與已經為OpenAI批次API建立的費率保持一致,為非真實的時間處理任務提供了可預測的成本結構。

了解績效折衷

大量成本儲蓄需要開發人員接受一定的限制。 Flex處理在較低的計算列表上進行操作,這意味著API的響應本質上需要比標準層的請求更長的時間。

此外,OpenAi明確警告“

。但是,OpenAI允許較低層的用戶(1-3)中的用戶獲得對O3的API訪問,包括相關功能,例如推理摘要和流媒體支持。這與OpenAI旨在確保負責平台使用的陳述政策是一致的。