OpenAI測試“思維工作"為CHATGPT，在GPT-5反彈之後為用戶提供了更多的控制

隨著GPT-5型號的動盪推出，OpenAI正在測試Chatgpt的新“思維工作”功能，從而為用戶提供了對AI性能的顆粒狀控制。實驗環境在8月下旬發現，使用戶可以從四個級別的計算強度中進行選擇。

此舉是對損壞GPT-5發射的廣泛批評的直接響應，該批評促使該公司還原其流行的GPT-4O模型並添加手動控件。通過讓用戶平衡響應速度與分析深度，OpenAI的目標是解決可靠性問題並改善用戶體驗。目的是消除首席執行官山姆·奧特曼（Sam Altman）所說的不同模型的“混亂混亂”。但是，雄心勃勃的策略很快就揭開了。該模型發明了虛構的狀態名稱，例如“ Onegon”，在基本數學上失敗了，並產生了荒謬的輸出，從而導致了廣泛的反彈。公眾接待是如此負面，以至於該公司被迫陷入罕見的防禦姿態。

8月8日，阿爾特曼（Altman）發出了公眾道歉。他承認，模型的內部模式之間的“有缺陷的“自動開關”使它的“笨拙”比預期的要長，”將技術缺陷歸咎於糟糕的表現。這種絆腳石為批評家提供了彈藥，並為競爭對手創造了一個開幕式，他們很快就可以利用這種情況。

幾天后，8月12日，Openai執行了重大的逆轉。它恢復了GPT-4O，用於支付訂戶並為GPT-5引入手動模式:“自動”，“快速”和“思考”。這個樞紐指示了AI領導者關於平衡創新與用戶期望的主要課程。

新的“思考工作”功能似乎是該課程校正的更詳細的演變。阿爾特曼本人暗示了這一轉變，他說:“從過去的幾天開始，我們真的只需要到達一個擁有更多按用戶自定義模型個性的世界。

Openai的Chatgpt副總裁Nick Turley，Nick Turley，尼克·特利（Nick Turley），承認這是一個迭代的過程，我們並不總是能夠快速地嘗試＃1，這是一個快速的努力，這是一個快速的努力。用戶反饋。

在引擎蓋下:“思維工作”如何工作

新的努力選擇器使用戶直接影響了模型的計算預算。據報導，該功能呈現出四個不同級別的強度供用戶選擇。這些是“輕”，“標準”，“擴展”和“最大”和“最大”

新的chatgpt Web應用程序版本具有更新的（隱藏的）思維精力選擇器- Max Thinker – Max Thinking（200），擴展思維（48），標準思維（18），光思維（18），光思維（5）

pic.twitter.com/onwcbq4cuw

– tibor blaho（@btibor91）

該分層系統允許用戶根據特定任務量身定制AI的性能。用戶可能會選擇“輕”，以進行快速，簡單的問題，但在處理需要更徹底的推理的複雜問題（例如債券估值或代碼分析）時切換到“擴展”或“最大”。

這可能是新的分層績效策略的暗示，有可能打開簡單訂閱的未來貨幣化模型。它正式化了速度和質量之間的權衡，這是大規模AI部署中的核心挑戰。

對對AI安全性的更深層關注的反應

這不僅僅是對更大的用戶控制的推動，這不僅在於修復otched發射；它反映了一個更廣泛的行業，以AI的可靠性和安全性計算。 The feature arrives shortly after OpenAI and rival Anthropic published the results of joint safety tests on August 28.

Those evaluations, framed by some as a在AI軍備競賽中的“決鬥”揭示了兩家公司模型中令人震驚的缺陷。這些報告詳細介紹了諸如“極端粘糊精”之類的問題，模型將驗證用戶的妄想信念，並願意協助危險要求。

測試還強調了哲學上的鴻溝。 Anthropic的模型通常拒絕回答以避免錯誤，從而優先考慮效用。相比之下，OpenAi的模型更有幫助，但在受控測試中提供了更多的事實錯誤或幻覺，以提供更多的事實錯誤或幻覺。馬庫斯（Marcus）爭辯說:“沒有任何具有智力誠信的人仍然可以相信純正的縮放會使我們進入AGI，”對整個“更大的IS更好”範式質疑。

我在這裡的工作確實完成了。沒有任何具有智力完整性的人仍然可以相信，純縮放會使我們進入AGI。

gpt-5可能是中等定量的改進（並且可能更便宜），但它仍然以與前任，在國際象棋上，……

– Gary Marcus（Gary Marcus（Gary Marcus）（@Garymarcus）（@Garymarcus）<@garymarcus）的所有定性方式失敗。 href=“ https://twitter.com/garymarcus/status/1953939152594252170?ref_src=twsrc;在公司中聲稱，“安全文化和流程已將閃亮產品的倒退。 ”

通過將“思考工作”撥號直接放在用戶手中，OpenAI正在授權他們減輕其中的某些風險。此舉向從“單一適合所有”的自動化方法到更透明，可自定義且最終更具辯護的用戶體驗的戰略樞紐。

OpenAI測試“思維工作”為CHATGPT，在GPT-5反彈之後為用戶提供了更多的控制

Published by All Things Windows on August 31, 2025

在引擎蓋下:“思維工作”如何工作

對對AI安全性的更深層關注的反應

IT Info

FTC警告Google在“黨派” Gmail垃圾郵件過濾器上威脅調查

IT Info

未經授權的AI名人聊天機器人生成明確圖像的元元素

IT Info

Microsoft，Phison Debunk Windows 11 SSD失敗謠言，經過廣泛的測試

OpenAI測試“思維工作”為CHATGPT，在GPT-5反彈之後為用戶提供了更多的控制

Published by All Things Windows on August 31, 2025

在引擎蓋下:“思維工作”如何工作

對對AI安全性的更深層關注的反應

Related Posts

IT Info

FTC警告Google在“黨派” Gmail垃圾郵件過濾器上威脅調查

IT Info

未經授權的AI名人聊天機器人生成明確圖像的元元素

IT Info

Microsoft，Phison Debunk Windows 11 SSD失敗謠言，經過廣泛的測試