OpenAi引入了 swe-lancer ,一種旨在測試人工智能在現實世界中的軟件工程任務的基準測試與人類的自由職業者相比。

這些發現證實了一種在各種AI驅動的編碼工具上看到的模式:AI在結構化編程方面擅長,但努力診斷和解決沒有外部指導的錯誤。

該研究使用AI模型評估AI模型來自自由職業平台的任務,例如 upwork fiverr ,在短期編碼項目中經常僱用開發人員。雖然AI生成的代碼通常在句法上是正確的並迅速產生的,但Openai的研究突出了一個持續的缺陷- AI工具在檢測軟件問題的根本原因方面仍然不可靠。

根據Openai的研究,“代理人在本地化方面表現出色,但未能紮根原因,導致部分或有缺陷的解決方案。代理使用整個存儲庫中的關鍵字搜索來快速定位相關文件和功能,這很快就會指出問題的來源-通常比人類快得多。但是,他們經常對該問題的跨越多個組件或文件的了解有限,並且無法解決根本原因,從而導致解決方案不正確或不夠全面。可以放慢自主編碼的採用

,以使AI更深入地替換甚至補充軟件工程師,它需要超越單純的語法校正並學習如何解決自己的錯誤/p>

OpenAI的發現表明,當今的AI模型在很大程度上依賴於模式識別,而不是真正解決問題的技能。 P>這些結果在Github Copilot的背景下尤其重要,這是使用AI最廣泛的編碼助手之一,而Github Copilot可以生成功能代碼段,它因未能檢測到邏輯缺陷而受到批評。

探討了自主AI開發人員的潛力,調試挑戰仍然是一個主要障礙。 Devin的認知聲稱可以充當自給自足的軟件工程師。但是,OpenAI的研究引起了人們對任何AI是否可以在復雜開發環境中真正獨立運作的懷疑。

自由職業者已經感覺到AI驅動的編碼的影響

雖然AI尚未完全替換軟件開發人員,但它已經在改變自由職業市場。 a 牛津互聯網研究所的研究發現,隨著企業越來越多地採用基於AI的自動化,軟件開發和寫作方面的自由職業工作下降了21%。

研究人員指出,儘管AI正在減少對某些編碼任務的需求,但同時增加了對可以監督AI輔助開發的工程師的需求。

自由職業者正在發現AI-ai-ai-ai-ai-生成的代碼可以替換一些常規任務,公司仍然需要人工工程師來調試,驗證和優化AI生成的工作。這種轉變迫使獨立開發人員適應,專注於更高級別的問題解決而不是基本編碼。

AI在軟件工程中的作用正在改變(但不取代)-開發人員 <

隨著AI驅動的編碼工具的不斷發展,公司和開發人員正在適應新的工作流程。自動化沒有消除工作,而是改變了軟件工程師的角色。現在,企業尋求可以管理AI輔助編程,監督AI生成的代碼的專業人員,並對AI模型無法捕獲的錯誤進行故障排除。

根據提到的研究,AI驅動的軟件開發正在增加對具有AI相關專業知識的工程師。它指出:“了解如何指導AI,驗證其輸出和糾正其錯誤的開發人員在未來的軟件開發角色中可能更有價值。”

OpenAI的SWE-Lancer結果突出顯示為什麼AI編碼工具為什麼仍然需要人工干預。 P> openai的發現提高了對AI的調試功能的疑問,公司正在嘗試解決這些問題。但是,軟件工程團隊的運作方式。

但是,除非AI系統能夠進行邏輯推理和獨立調試,否則工程師將繼續在軟件開發中發揮核心作用。

AI輔助開發的未來:技能集的轉變

隨著AI的開發方式,該行業正在看到最需要的技能的變化。與管理,優化和故障排除AI生成的工作的能力相比,傳統的編碼能力變得越來越重要。這種過渡反映了軟件工程中過去的演變,其中自動化減少了手動編碼工作,但增加了對質量控制和建築計劃的需求。

自由市場已經在適應。專注於基本編碼任務的自由開發人員的機會下降,而對AI技能工程師的需求正在上升。了解AI輔助開發的工程師將更好地駕駛這種不斷變化的景觀。

在此階段,AI尚未準備好在復雜的軟件開發中獨立工作。但是,它在簡化和優化某些任務中的作用將繼續增長。更強的AI推理模型是否可以克服當前的調試限制還有待觀察,但是目前,人類專業知識在編碼過程中仍然是必不可少的。

Categories: IT Info