AI 編碼 IDE Cursor 於 10 月 29 日推出了其第一個內部模型 Composer。它的發布恰逢主要平台更新 Cursor 2.0。
優先考慮速度,該公司聲稱新的 Composer 模型比類似工具快四倍。
Cursor 2.0 引入了重新設計的界面,用於並行管理多個 AI 代理。開發人員現在可以比較同一任務上不同模型的輸出。
 
 
雖然該發布因其性能贏得了早期用戶的讚揚,但也因其模型起源和使用私人性能基準缺乏透明度而受到批評。
對速度的需求:引入 Composer 模型
為了讓開發人員保持流暢狀態,Cursor 將 Composer 定位為專為低延遲、交互式編碼而構建的前沿模型。 Cursor 將其描述為專家混合 (MoE) 模型。它專門通過強化學習 (RL) 進行軟件工程。
在訓練過程中,該模型可以使用語義搜索等工具,並負責解決現實世界的編碼挑戰。據 Cursor 稱,該模型能夠在 30 秒內完成大多數智能轉彎。這樣的性能使其比類似智能競爭對手快四倍。
但是,這些性能聲明是基於名為“Cursor Bench”的專有內部評估。該基準由公司自己的工程師提出的真實代理請求組成。缺乏公開的、可複制的基準已成為發布後爭論的焦點。
儘管保密,該公司的定價一直是透明的。 根據其官方文檔,Composer 模型每百萬個輸入代幣的成本為 1.25 美元,每百萬個輸出代幣的成本為 10.00 美元。它在 Cursor 環境中的價格與 GPT-5 和 Gemini 2.5 Pro 相同,表明對其功能充滿信心。
雜耍代理:Cursor 2.0 中的新界面
除了新模型之外,Cursor 2.0 的發布也標誌著 IDE 設計的重大轉變。它從以文件為中心轉變為以代理為中心的工作流程。其更新的界面旨在並行運行多個代理,而不會相互干擾。
為這種多代理架構提供動力的是 git 工作樹或遠程計算機。這些工具為每個代理創建隔離的工作環境,防止衝突。
使用此設置,開發人員可以同時將相同的複雜任務分配給不同的模型,例如,要求 Sonnet 4.5 和 Composer 實現某個功能。
然後用戶可以比較結果並選擇最佳方法。該工作流程被稱為“vibe 編碼”,作為利用各種人工智能模型獨特優勢的一種方式,它正在獲得越來越多的關注。 Google 最近以類似的理念改進了 AI Studio。
更新中還包括簡化代碼審查和測試的工具,進一步將 AI 融入到開發生命週期中。
兩極分化:社區讚揚和懷疑
雙重發布引發了一波討論,開發者社區內部意見分歧很大。雖然一些用戶稱讚新模型的響應能力,但其他用戶報告了重大問題。 討論此次發布的黑客新聞主題完美地捕捉到了這種兩極分化的情緒。
一方面,早期採用者讚揚了新模型的性能。一位用戶寫道,“Composer 一切都做得更好,沒有在 Codex 失敗的地方犯錯,最重要的是,速度帶來了巨大的變化。使用起來非常舒服,恭喜。”
另一方面,一些用戶報告了令人沮喪的初始體驗。其中一位評論道,“我今晚使用了新系統,感覺就像是明顯的降級。生成了一些無法運行的基本應用程序,無法在 NextJS 環境中處理 CSS。”
對公司聲明的懷疑很快就出現在 Hacker News 等平台上。主要的批評集中在缺乏透明度上。
正如一位用戶所指出的,“這裡缺乏透明度是瘋狂的。他們匯總了所測試模型的分數,這掩蓋了性能。他們只根據自己不會發布的內部基準發布結果。”
與這種觀點相呼應的是,其他人質疑 Composer 訓練的未公開基本模型,這使得獨立評估其架構或潛在偏差變得困難。
內部模型,它是更大行業趨勢的一部分。速度和專業化正在成為關鍵的差異化因素。
在評論中,Cursor ML 研究人員制定了公司的戰略,並表示:“我們的觀點是,現在只需要最低限度的智能即可實現生產力,如果能將其與速度結合起來,那就太棒了。”
這種理念使 Composer 直接與來自主要實驗室的更強大但可能更慢的模型進行對抗。
然而,對於一些開發人員來說,原始智能仍然存在。重中之重。正如一位用戶指出的那樣,“也許我是個異類,但 Sonnet 4.5 的質量大約是我願意接受的最低水平。它的生成速度不是問題或時間消耗。它正在與它搏鬥以獲得正確的輸出。” Cursor 的戰略將其置於競爭激烈的市場中。
GitHub 最近推出了自己的多代理平台 Agent HQ,該平台將 OpenAI、Anthropic 和 Google 的模型整合在一個控制平面下。
與此同時,Anthropic 等個體提供商繼續完善其產品,例如最近推出的 Claude Code for web。
通過構建自己的模型,Cursor 押注於提供緊密集成的高速體驗可以培養忠實的用戶群,即使這意味著犧牲最大前沿模型的一些原始力量。
 
													