Microsoft has officially launched Copilot Vision for Windows, rolling out its AI-powered screen-sharing assistant for free to all users in the United States on both Windows 10 and Windows 11. The release fundamentally transforms the AI from a simple chatbot into a deeply integrated system-wide tool that can visually analyze and interact with content across any open application, including two simultaneously.

This move positions Copilot as an active guide for users,公司在其

用戶的重要性在於這種新的交互式輔助層。該功能包括屏幕上的“亮點”,可以在視覺上引導用戶在哪裡單擊以完成任務,從而有效地在軟件中提供逐步指導。從被動AI到主動的跨申請合作夥伴的這一轉變標誌著Microsoft策略將人工智能嵌入Windows操作系統核心的策略。

從付費預覽到所有

公眾啟動Copilot Vision是從利基實驗到廣泛部署的經過精心管理的進化的高潮。旅程始於2024年底,其初始測試僅限於Edge瀏覽器,並要求用戶擁有付費的副駕駛專業訂閱。該早期報告中詳細介紹了該潛力,但仍局限於瀏覽器。

4月,該功能開始向Windows Insiders推出,從瀏覽器中解散以與用戶屏幕上的任何應用程序一起使用。該預覽是在Windows Insider博客上的公告中首次揭示的,這清楚地表明了Microsoft的意圖將AI更深入地嵌入操作系統本身。 The full public release finalizes this transition, making the advanced cross-application functionality available to everyone in the US and solidifying its status as a core Windows feature.

[embedded content]

Your Second Set of Eyes: How It Works

Copilot Vision functions as an on-demand assistant that the user must explicitly activate by clicking a distinct “glasses icon”within the Copilot app.從那裡,用戶可以選擇同時共享一個甚至兩個應用程序的觀點,從而使AI獲得上下文並在它們之間連接信息。 Copilot Vision具有實際實用性,因為AI可以指導用戶在圖像編輯軟件中刪除照片反射,並指導用戶通過流行軟件應用程序的接口。

伴侶“突出顯示”功能增強了體驗,該功能可以積極地從應用程序和文檔中表面有用的內容,而無需特定的提示。此功能是刷新的副本接口的一部分,該接口將其停靠到屏幕側面。 Alongside Vision, Microsoft has also been testing a “File Search”capability, which empowers Copilot to locate and answer questions about information contained within local files like PDFs, spreadsheets, and documents.

Privacy in Focus: Learning from “Windows Recall”

Microsoft is pointedly emphasizing user control with Copilot Vision’s design, a move that seems deliberately timed to在圍繞其Windows召回功能的爭議之後,解決了潛在的問題。用戶必須積極選擇與助手共享特定窗口,以便查看或分析屏幕上的內容。 這種選擇加入模型與其他AI系統的更具被動的數據捕獲形成鮮明對比。

這種以隱私為中心的方法是微軟在越來越擁擠的AI市場中策略的關鍵部分。該公司強調,所有經過分析的內容都是短暫的,發言人證實,助手與之互動的內容都沒有存儲或用於培訓,並且一旦會議結束,它就會永久刪除。 

這將發射定位為微軟對競爭對手的回答,使其與Google的Gemini Live等系統進行了直接競爭。在實驗性copilot Labs 程序中,Microsoft測試其最新的AI創新。 Microsoft多年來一直在發展的視覺語言模型。該工具的基礎是2024年6月宣布佛羅倫薩-2模型的預覽。該技術代表了效率的重大飛躍,其統一,基於及時的架構允許單個,輕巧的模型來處理字幕檢測和先前需要多個專業系統的多個任務。

,該技術並非沒有限制。更廣泛的視野AI仍然面臨著重大障礙,從2024年10月開始的一項最新研究暴露了領先模型中的嚴重缺陷,這在需要基本的模式識別和推理的視覺難題中掙扎。這種情況下強調的是,儘管Copilot Vision代表了實際AI援助方面的重要一步,但基礎技術仍在積極開發和改進的道路上。

最終,副銅願景的啟動不僅僅是功能更新;這是AI作為Windows操作系統的核心實用程序的戰略重新定位。通過製作一個強大的,跨應用程序的助手,微軟押注了其對個人計算的未來的願景。它的成功很可能取決於用戶是否接受AI“日常伴侶”的新範式,並相信其隱私優先,選擇加入設計對競爭對手的更集成但透明的模型較少。

Categories: IT Info