微軟今天在 Microsoft 365 Copilot 中推出了對 Researcher 代理的重大升級,這是邁向更加自主的人工智能的重要一步。

該公司添加了一項“計算機使用”功能,該功能將代理從僅僅查找和合成信息的工具轉變為可以代表用戶主動執行任務

此功能允許 AI 導航複雜的網站、與經過身份驗證的內容交互並自動執行多步驟工作流程,標誌著 Microsoft 企業的重大發展AI 戰略。

今天在公司的 Frontier 計劃,該功能旨在解決簡單網絡搜索之外的研究任務,例如訪問基於訂閱的行業報告或從交互式網站收集數據。

從推理到行動:“計算機使用”的工作原理

這一新功能的基礎是一個複雜的架構,該架構使研究人員代理能夠受控地訪問安全的虛擬化計算機。

當用戶激活時“計算機使用”,Copilot 提供了一個在 Windows 365 上運行的臨時沙盒虛擬機。基於雲的環境配備了完整的 Web 瀏覽器和命令行終端,使代理能夠像人類助手一樣操作。

在這個沙盒環境中,代理可以利用可視化瀏覽器來導航 Web 界面、使用文本瀏覽器來更快地提取數據,以及用於更高級的代碼驅動場景的終端。

現在的功能擴展了代理的功能技能遠遠超出了其最初的範圍,該範圍於 6 月份全面開放。現在,它可以單擊按鈕、輸入表單以及瀏覽需要憑據的門控內容。

例如,用戶可以要求研究人員登錄社交媒體網站查找最新新聞,為客戶會議做準備。微軟建議的指導原則是,“如果一個人可以使用該應用程序,那麼代理也可以。”

為了確保透明度和用戶信任,該系統提供了“視覺思想鏈”。此界面實時顯示代理操作的用戶屏幕截圖和終端輸出,允許持續監控並保留用戶對整個工作流程的控制。

沙盒環境中的企業級安全性

對於企業客戶來說,安全性仍然是最重要的問題,Microsoft 內置了多層保護。該進程在臨時沙箱中運行,與用戶設備和公司內部網絡完全網絡隔離。

不會將用戶憑據傳輸到或存儲在該環境中。當需要登錄時,研究人員會提示用戶通過安全的屏幕共享連接來直接控制會話,以輸入其憑據。

此外,來自沙箱的所有出站網絡流量都通過採用安全分類器的代理進行路由。這些分類器驗證代理的 Web 訪問是否安全且與用戶的原始請求相關,有助於防止潛在的越獄或跨站點腳本攻擊。這種智能自動化專為恢復能力而設計。

[嵌入內容]

根據 Microsoft 的說法,“它使用內置推理進行實時調整以自行解決問題,因此工作可以不間斷地繼續進行。”

為了降低數據洩露的風險,只要激活“計算機使用”,默認情況下就會禁用對用戶內部企業數據(例如文件、聊天和電子郵件)的訪問。不過,用戶可以選擇通過新的源菜單授予對其任務所需的特定數據源的訪問權限。

管理員還可以進行精細控制,能夠為特定安全組啟用該功能並為網站創建自定義允許或拒絕列表。

更智能的研究、可衡量的收益和可用性

Microsoft 支持此次發布,data from leading AI benchmarks that measure complex reasoning and browsing tasks.在 BrowseComp 基準測試中,Researcher with Computer Use 的表現比其前任提高了 44%。它還比 GAIA 基準測試提高了 6%,該基準測試人工智能在現實世界數據集中查找和推理的能力。在一項具有挑戰性的 GAIA 任務中,代理成功找到了相關的世界銀行數據集,直接通過終端下載,並使用 Python 提取和過濾數據以生成經過驗證的答案。

此次發布是微軟更廣泛地推進所謂的“代理人工智能”的關鍵部分,這一趨勢旨在創建能夠自主執行複雜、多步驟任務的助手。在此之前,最近推出了其他專門用於 Excel 和 Word 中“vibeworking”的代理,這些代理也旨在通過簡單的提示自動創建複雜的文檔。該戰略還強調了微軟對多模型方法的日益依賴,即利用 Anthropic 等合作夥伴及其主要合作夥伴 OpenAI 的人工智能來為特定工作選擇最佳工具。

這一戰略舉措也與 4 月份為微軟 Copilot Studio 低代碼平台預覽的類似名稱的“計算機使用”功能相一致。一致的命名和功能表明了創建可以在從企業研究到定制業務應用程序的數字環境中運行的人工智能代理的統一願景。通過構建這些強大的功能,微軟旨在鞏固其作為不可或缺的人工智能基礎設施提供商的地位,超越簡單的聊天界面,提供切實的自動化。

Categories: IT Info