OpenAI已正式推出了其GPT-4.1型號家族,引入了三個新版本,例如GPT-4.1,GPT-4.1 Mini和GPT-4.1 Nano-,其目的是在頂級性能和靈活的成本和速度之間取得平衡。 GPT-4.1系列為了勝過其前任,可提高核心功能,例如代碼生成,說明後面和長篇文化推理,同時提供較低的延遲和更一致的工具用法。
與GPT-4和GPT-4O不同,該公司適用於專業用戶,新型號可通過OpenAI API獨家提供,這是該公司繼續關注企業和開發人員集成而不是面向消費者的Chatbot使用。
的發行不僅僅是技術上的applade intergrade in Platergrade in Plestable carteral interple narry interple n plotit interlet oppeant stript。通過將新模型分為三個不同的性能層,OpenAI可以使API用戶能夠根據工作負載的規模和預算進行擴展。在頂部,標準的GPT-4.1型號是為最複雜的應用而設計的,並且相應地定價:每百萬個輸入令牌2美元和每百萬美元產量令牌8美元。
gpt-4.1 mini是一個中間的選擇,在智能基準標準中提供的均等水平均低得多,其延遲較低-每百萬個輸入令牌為0.40美元,每百萬美元產量為1.60美元。 For lightweight tasks and real-time use cases, GPT-4.1 Nano is the most cost-efficient yet, costing just $0.10 per million input tokens and $0.40 per million output tokens.
Each model comes with performance trade-offs, but OpenAI claims that even the smallest model, Nano, outperforms previous offerings like GPT-4o Mini in multiple benchmarks.這些增加反映了Openai越來越強調使在更廣泛的用例中訪問的生成AI(從高性能代理工作流程到嵌入消費者應用程序中的工具)。
值得注意的是,所有三個模型都具有相同的知識截止(2024年6月),並已調用以提供比早期幾代人更確定性,格式遵循的輸出-盤位降低幻覺並提高生產環境中的整合性可靠性。
跨越了gpt-4.4.1變化的型號-在gpt-4.4.1的範圍內提出了一種旨在的趨勢-旨在使MINTIANT傾向於MIN-1 APTINT的趨勢-旨在MIN-1 APTINT傾向於MIN-1 APTIANT的推出-僅是用於研究和原型製作,而是用於商業軟件,SaaS平台和自主代理系統中的大規模部署。由於GPT-4.1現在被定位為即將被剝奪的GPT-4.5預覽(截至2025年7月14日)的繼任者,Openai明確表示,預計這一代人將承擔許多商業夥伴的運營權重,其許多商業夥伴的運作重量。
[嵌入式內容]
swe-bench驗證的基準上,得分為54.6%,標誌著GPT-4O的絕對超過21.4%,超過了26.6%的GPT-GPT-44.5。
在以下說明中,gpt-4.1在 scale的多鍵式基準標準中,反映了比GPT-4O的絕對絕對的10.5%。
”
Additionally, GPT-4.1 set a new state-of-the-art result on the Video-MME benchmark for multimodal long-context understanding, scoring 72.0% on the “long, no subtitles”category, a 6.7% absolute improvement over GPT-4O。
OpenAI還引入了兩個簡化版本:GPT-4.1 Mini和GPT-4.1 Nano。 GPT-4.1 MINI提供了延遲和成本的降低,與GPT-4O相比,延遲近一半,成本降低了83%,同時匹配或超過GPT-4O在情報評估中的表現。
”
gpt-4.1 Nano是OpenAI迄今為止最小,最快的模型,針對需要低延遲和成本效率的任務進行了優化。 It supports a context window of up to 1 million tokens and scores 80.1% on MMLU, 50.3% on GPQA, and 9.8% on Aider polyglot coding benchmarks, surpassing GPT-4o Mini’s performance.
These models are available exclusively through OpenAI’s API, catering to developers seeking to integrate advanced AI capabilities into their applications.這些模型的定價如下:GPT-4.1,每百萬美元投入令牌2美元和每百萬產量令牌8美元; GPT-4.1 Mini,每百萬美元投入令牌,每百萬美元的產出代幣$ 0.40; GPT-4.1納米(Nano)為每百萬美元的投入令牌0.10美元,每百萬個產出代幣0.40美元。
”
增強了以下和長篇文章理解的指令
OpenAI致力於提高模型遵循指令並理解長篇文章輸入的能力。 GPT-4.1型號旨在更好地利用廣泛的上下文窗口,支持多達100萬個令牌,並展示了改進的長篇小說理解。這些增強功能使模型更有效地為能夠代表用戶獨立完成任務(例如軟件工程,文檔分析和客戶支持)獨立完成任務的AI代理。
根據Openai的說法,“這些改進的可靠性和長期情況下的教學改進和長期的上下文理解的改進也使GPT-4.1的模型還可以使persing Agents Onspriment of Indectilent of Systems of Indections of Indections of Indections ”
模型限制和考慮因素
雖然GPT-4.1模型提供了有意義的進步,但OpenAI承認某些局限性。這些模型可能比以前的版本更具字面意義,有時需要用戶更具體而明確的提示。另外,隨著輸入令牌的數量的增加,模型的準確性也會降低。在OpenAI自己的測試中,準確性從約84%下降,8,000令牌降至50%,並以1,024個令牌為單位。
OpenAI還指出,GPT-4.1的準確性越來越不那麼可靠,它必須處理的輸入越多,強調了及時的工程和上下文管理在應用程序開發中的重要性。該公司在其官方帖子中指出:“早期測試人員指出,GPT −4.1可能更具字面意義,因此我們建議在提示中明確和具體。”
此外,GPT-4.5預覽模型將於2025年7月14日棄用,為GPT-4.1的更廣泛採用。較新的型號具有2024年6月的知識截止,與早期版本相比,開發人員可以訪問更多當前數據。
swe-bench驗證的基準上,得分為54.6%,標誌著GPT-4O的絕對超過21.4%,超過了26.6%的GPT-GPT-44.5。
在以下說明中,gpt-4.1在 scale的多鍵式基準標準中,反映了比GPT-4O的絕對絕對的10.5%。
”
Additionally, GPT-4.1 set a new state-of-the-art result on the Video-MME benchmark for multimodal long-context understanding, scoring 72.0% on the “long, no subtitles”category, a 6.7% absolute improvement over GPT-4O。
OpenAI還引入了兩個簡化版本:GPT-4.1 Mini和GPT-4.1 Nano。 GPT-4.1 MINI提供了延遲和成本的降低,與GPT-4O相比,延遲近一半,成本降低了83%,同時匹配或超過GPT-4O在情報評估中的表現。
”
gpt-4.1 Nano是OpenAI迄今為止最小,最快的模型,針對需要低延遲和成本效率的任務進行了優化。 It supports a context window of up to 1 million tokens and scores 80.1% on MMLU, 50.3% on GPQA, and 9.8% on Aider polyglot coding benchmarks, surpassing GPT-4o Mini’s performance.
These models are available exclusively through OpenAI’s API, catering to developers seeking to integrate advanced AI capabilities into their applications.這些模型的定價如下:GPT-4.1,每百萬美元投入令牌2美元和每百萬產量令牌8美元; GPT-4.1 Mini,每百萬美元投入令牌,每百萬美元的產出代幣$ 0.40; GPT-4.1納米(Nano)為每百萬美元的投入令牌0.10美元,每百萬個產出代幣0.40美元。
”
增強了以下和長篇文章理解的指令
OpenAI致力於提高模型遵循指令並理解長篇文章輸入的能力。 GPT-4.1型號旨在更好地利用廣泛的上下文窗口,支持多達100萬個令牌,並展示了改進的長篇小說理解。這些增強功能使模型更有效地為能夠代表用戶獨立完成任務(例如軟件工程,文檔分析和客戶支持)獨立完成任務的AI代理。
根據Openai的說法,“這些改進的可靠性和長期情況下的教學改進和長期的上下文理解的改進也使GPT-4.1的模型還可以使persing Agents Onspriment of Indectilent of Systems of Indections of Indections of Indections ”
模型限制和考慮因素
雖然GPT-4.1模型提供了有意義的進步,但OpenAI承認某些局限性。這些模型可能比以前的版本更具字面意義,有時需要用戶更具體而明確的提示。另外,隨著輸入令牌的數量的增加,模型的準確性也會降低。在OpenAI自己的測試中,準確性從約84%下降,8,000令牌降至50%,並以1,024個令牌為單位。
OpenAI還指出,GPT-4.1的準確性越來越不那麼可靠,它必須處理的輸入越多,強調了及時的工程和上下文管理在應用程序開發中的重要性。該公司在其官方帖子中指出:“早期測試人員指出,GPT −4.1可能更具字面意義,因此我們建議在提示中明確和具體。”
此外,GPT-4.5預覽模型將於2025年7月14日棄用,為GPT-4.1的更廣泛採用。較新的型號具有2024年6月的知識截止,與早期版本相比,開發人員可以訪問更多當前數據。
swe-bench驗證的基準上,得分為54.6%,標誌著GPT-4O的絕對超過21.4%,超過了26.6%的GPT-GPT-44.5。
在以下說明中,gpt-4.1在 scale的多鍵式基準標準中,反映了比GPT-4O的絕對絕對的10.5%。
”
Additionally, GPT-4.1 set a new state-of-the-art result on the Video-MME benchmark for multimodal long-context understanding, scoring 72.0% on the “long, no subtitles”category, a 6.7% absolute improvement over GPT-4O。
OpenAI還引入了兩個簡化版本:GPT-4.1 Mini和GPT-4.1 Nano。 GPT-4.1 MINI提供了延遲和成本的降低,與GPT-4O相比,延遲近一半,成本降低了83%,同時匹配或超過GPT-4O在情報評估中的表現。
”
gpt-4.1 Nano是OpenAI迄今為止最小,最快的模型,針對需要低延遲和成本效率的任務進行了優化。 It supports a context window of up to 1 million tokens and scores 80.1% on MMLU, 50.3% on GPQA, and 9.8% on Aider polyglot coding benchmarks, surpassing GPT-4o Mini’s performance.
These models are available exclusively through OpenAI’s API, catering to developers seeking to integrate advanced AI capabilities into their applications.這些模型的定價如下:GPT-4.1,每百萬美元投入令牌2美元和每百萬產量令牌8美元; GPT-4.1 Mini,每百萬美元投入令牌,每百萬美元的產出代幣$ 0.40; GPT-4.1納米(Nano)為每百萬美元的投入令牌0.10美元,每百萬個產出代幣0.40美元。
”
增強了以下和長篇文章理解的指令
OpenAI致力於提高模型遵循指令並理解長篇文章輸入的能力。 GPT-4.1型號旨在更好地利用廣泛的上下文窗口,支持多達100萬個令牌,並展示了改進的長篇小說理解。這些增強功能使模型更有效地為能夠代表用戶獨立完成任務(例如軟件工程,文檔分析和客戶支持)獨立完成任務的AI代理。
根據Openai的說法,“這些改進的可靠性和長期情況下的教學改進和長期的上下文理解的改進也使GPT-4.1的模型還可以使persing Agents Onspriment of Indectilent of Systems of Indections of Indections of Indections ”
模型限制和考慮因素
雖然GPT-4.1模型提供了有意義的進步,但OpenAI承認某些局限性。這些模型可能比以前的版本更具字面意義,有時需要用戶更具體而明確的提示。另外,隨著輸入令牌的數量的增加,模型的準確性也會降低。在OpenAI自己的測試中,準確性從約84%下降,8,000令牌降至50%,並以1,024個令牌為單位。
OpenAI還指出,GPT-4.1的準確性越來越不那麼可靠,它必須處理的輸入越多,強調了及時的工程和上下文管理在應用程序開發中的重要性。該公司在其官方帖子中指出:“早期測試人員指出,GPT −4.1可能更具字面意義,因此我們建議在提示中明確和具體。”
此外,GPT-4.5預覽模型將於2025年7月14日棄用,為GPT-4.1的更廣泛採用。較新的型號具有2024年6月的知識截止,與早期版本相比,開發人員可以訪問更多當前數據。
swe-bench驗證的基準上,得分為54.6%,標誌著GPT-4O的絕對超過21.4%,超過了26.6%的GPT-GPT-44.5。
在以下說明中,gpt-4.1在 scale的多鍵式基準標準中,反映了比GPT-4O的絕對絕對的10.5%。
”
Additionally, GPT-4.1 set a new state-of-the-art result on the Video-MME benchmark for multimodal long-context understanding, scoring 72.0% on the “long, no subtitles”category, a 6.7% absolute improvement over GPT-4O。
OpenAI還引入了兩個簡化版本:GPT-4.1 Mini和GPT-4.1 Nano。 GPT-4.1 MINI提供了延遲和成本的降低,與GPT-4O相比,延遲近一半,成本降低了83%,同時匹配或超過GPT-4O在情報評估中的表現。
”
gpt-4.1 Nano是OpenAI迄今為止最小,最快的模型,針對需要低延遲和成本效率的任務進行了優化。 It supports a context window of up to 1 million tokens and scores 80.1% on MMLU, 50.3% on GPQA, and 9.8% on Aider polyglot coding benchmarks, surpassing GPT-4o Mini’s performance.
These models are available exclusively through OpenAI’s API, catering to developers seeking to integrate advanced AI capabilities into their applications.這些模型的定價如下:GPT-4.1,每百萬美元投入令牌2美元和每百萬產量令牌8美元; GPT-4.1 Mini,每百萬美元投入令牌,每百萬美元的產出代幣$ 0.40; GPT-4.1納米(Nano)為每百萬美元的投入令牌0.10美元,每百萬個產出代幣0.40美元。
”
增強了以下和長篇文章理解的指令
OpenAI致力於提高模型遵循指令並理解長篇文章輸入的能力。 GPT-4.1型號旨在更好地利用廣泛的上下文窗口,支持多達100萬個令牌,並展示了改進的長篇小說理解。這些增強功能使模型更有效地為能夠代表用戶獨立完成任務(例如軟件工程,文檔分析和客戶支持)獨立完成任務的AI代理。
根據Openai的說法,“這些改進的可靠性和長期情況下的教學改進和長期的上下文理解的改進也使GPT-4.1的模型還可以使persing Agents Onspriment of Indectilent of Systems of Indections of Indections of Indections ”
模型限制和考慮因素
雖然GPT-4.1模型提供了有意義的進步,但OpenAI承認某些局限性。這些模型可能比以前的版本更具字面意義,有時需要用戶更具體而明確的提示。另外,隨著輸入令牌的數量的增加,模型的準確性也會降低。在OpenAI自己的測試中,準確性從約84%下降,8,000令牌降至50%,並以1,024個令牌為單位。
OpenAI還指出,GPT-4.1的準確性越來越不那麼可靠,它必須處理的輸入越多,強調了及時的工程和上下文管理在應用程序開發中的重要性。該公司在其官方帖子中指出:“早期測試人員指出,GPT −4.1可能更具字面意義,因此我們建議在提示中明確和具體。”
此外,GPT-4.5預覽模型將於2025年7月14日棄用,為GPT-4.1的更廣泛採用。較新的型號具有2024年6月的知識截止,與早期版本相比,開發人員可以訪問更多當前數據。
在以下說明中,gpt-4.1在 scale的多鍵式基準標準中,反映了比GPT-4O的絕對絕對的10.5%。
”
Additionally, GPT-4.1 set a new state-of-the-art result on the Video-MME benchmark for multimodal long-context understanding, scoring 72.0% on the “long, no subtitles”category, a 6.7% absolute improvement over GPT-4O。
OpenAI還引入了兩個簡化版本:GPT-4.1 Mini和GPT-4.1 Nano。 GPT-4.1 MINI提供了延遲和成本的降低,與GPT-4O相比,延遲近一半,成本降低了83%,同時匹配或超過GPT-4O在情報評估中的表現。
”
gpt-4.1 Nano是OpenAI迄今為止最小,最快的模型,針對需要低延遲和成本效率的任務進行了優化。 It supports a context window of up to 1 million tokens and scores 80.1% on MMLU, 50.3% on GPQA, and 9.8% on Aider polyglot coding benchmarks, surpassing GPT-4o Mini’s performance.
These models are available exclusively through OpenAI’s API, catering to developers seeking to integrate advanced AI capabilities into their applications.這些模型的定價如下:GPT-4.1,每百萬美元投入令牌2美元和每百萬產量令牌8美元; GPT-4.1 Mini,每百萬美元投入令牌,每百萬美元的產出代幣$ 0.40; GPT-4.1納米(Nano)為每百萬美元的投入令牌0.10美元,每百萬個產出代幣0.40美元。
”
增強了以下和長篇文章理解的指令
OpenAI致力於提高模型遵循指令並理解長篇文章輸入的能力。 GPT-4.1型號旨在更好地利用廣泛的上下文窗口,支持多達100萬個令牌,並展示了改進的長篇小說理解。這些增強功能使模型更有效地為能夠代表用戶獨立完成任務(例如軟件工程,文檔分析和客戶支持)獨立完成任務的AI代理。
根據Openai的說法,“這些改進的可靠性和長期情況下的教學改進和長期的上下文理解的改進也使GPT-4.1的模型還可以使persing Agents Onspriment of Indectilent of Systems of Indections of Indections of Indections
模型限制和考慮因素
雖然GPT-4.1模型提供了有意義的進步,但OpenAI承認某些局限性。這些模型可能比以前的版本更具字面意義,有時需要用戶更具體而明確的提示。另外,隨著輸入令牌的數量的增加,模型的準確性也會降低。在OpenAI自己的測試中,準確性從約84%下降,8,000令牌降至50%,並以1,024個令牌為單位。
OpenAI還指出,GPT-4.1的準確性越來越不那麼可靠,它必須處理的輸入越多,強調了及時的工程和上下文管理在應用程序開發中的重要性。該公司在其官方帖子中指出:“早期測試人員指出,GPT −4.1可能更具字面意義,因此我們建議在提示中明確和具體。”
此外,GPT-4.5預覽模型將於2025年7月14日棄用,為GPT-4.1的更廣泛採用。較新的型號具有2024年6月的知識截止,與早期版本相比,開發人員可以訪問更多當前數據。