Devin 代理背後的人工智能實驗室 Cognition 推出了 SWE-1.5,這是一種新的高速編碼模型,通過優先考慮性能和速度來挑戰市場。
該模型於 10 月 29 日宣布,現已在 Cognition 於 7 月收購的 Windsurf IDE 中提供。該公司聲稱,得益於與推理提供商 Cerebras 的合作,SWE-1.5 的運行速度比 Anthropic 的 Sonnet 4.5 快 13 倍。
該版本發布之際,競爭對手 Cursor 推出了自己的快速模型 Composer,這標誌著人工智能代理公司正在構建專有模型以創建緊密集成、低延遲的開發人員體驗並減少對第三方 API 的依賴的新趨勢。
官方公告,“開發人員不必在思考速度快的人工智能和思考良好的人工智能之間做出選擇。”
這一理念是 SWE-1.5 的基礎,Cognition 將其描述為具有數千億參數的“前沿規模”模型,專門設計用於消除這種妥協並提供精英性能和一流的性能速度。
該模型最引人注目的特點是其原始速度,這是與推理專家 Cerebras 密切合作的結果。 Cognition 聲稱此次合作使 SWE-1.5 實現了顯著的延遲,並表示:“它還設定了新的速度標準:我們與 Cerebras 合作,以高達 950 tok/s 的速度提供服務,比 Haiku 4.5 快 6 倍,比 Sonnet 4.5 快 13 倍。”
這一性能飛躍旨在讓開發人員在 5 秒內完成任務,保持“心流狀態”,這是避免該公司所謂的“心流狀態”的關鍵閾值。 “半異步死亡之谷。”
優化工作超出了模型本身的範圍,因為它的速度揭示了 Windsurf IDE 中的新瓶頸,迫使團隊重寫 lint 檢查和命令執行管道等關鍵組件,以將系統開銷每步最多減少兩秒。
雖然 Cognition 的速度聲明很大膽,但該公司還提供了來自 SWE-Bench Pro 基準測試的數據來證實其性能。性能。
在由 41 個不同代碼存儲庫中的 731 個困難代理編碼任務組成的基準測試中,SWE-1.5 展示了其旨在克服的權衡。
雖然 Anthropic 的 Sonnet 4.5 取得了 43.60% 的最高分,但它的速度僅為 69 個令牌/秒。相比之下,SWE-1.5 提供了 40.08% 的極具競爭力的分數,實現了接近前沿的性能,但速度高達 950 個令牌/秒,速度提高了近 14 倍。
這使該模型成為需要高質量結果且不會出現其他頂級模型的工作流程中斷延遲的開發人員的強大工具。
基準測試結果顯示,SWE-1.5 的性能優於其他幾個值得注意的模型模型的準確性和速度。它超越了 Anthropic 的 Haiku 4.5(在 142 tok/s 時得分為 39.45%)和高級版本的 GPT-5(在 43 tok/s 時得分為 36.30%)。
新模型也代表了 Cognition 的一次巨大的代際飛躍,得分是其前身 SWE-1 的兩倍多,後者在 39 tok/s 時得分僅為 16.55%。這些數據強化了 Cognition 的中心論點:SWE-1.5 提供的性能可與市場上最好的產品競爭,同時設定了全新的速度標準。
 
													