OpenAI推出了Flex Processing,這是一個獨特的API服務層,旨在開發人員尋求更經濟的方式使用公司的O3和O4-Mini推理模型。該選項於2025年4月17日正式宣布,目前在Beta中宣布,與標準API率相比,該選項大大降低了人均成本,使高級AI在某些應用程序中可能更易於訪問,儘管它伴隨著性能權衡。
此新的Tier tiers特定目標是直接目標,而不是主要問題。 flex處理文檔指出了“模型評估,數據豐富”,“數據豐富”和“異步工作”諸如“理想候選人”的用例。它是用於低優先級或非生產工作的解決方案,在該解決方案中節省的成本優於速度的需求。
比較Flex與標准定價
flex處理可削減與這些模型的交互成本,從而削減成本。對於O3型號,使用Flex的開發人員將為每百萬美元的輸入令牌和20萬美元的產量代幣支付5美元,分別從10美元和40美元的標准率下降。
降低了50%的降低,價格為每百萬美元的投入令牌為0.55美元,而在Flex下的價格為2.20美元,而普通的1.10美元和4.40美元的價格為每百萬美元。這種定價結構與已經為OpenAI批次API建立的費率保持一致,為非真實的時間處理任務提供了可預測的成本結構。
了解績效折衷
大量成本儲蓄需要開發人員接受一定的限制。 Flex處理在較低的計算列表上進行操作,這意味著API的響應本質上需要比標準層的請求更長的時間。