Microsoftは、WindowsのCopilot Visionを正式に発売し、Windows 10とWindows 11の両方で米国のすべてのユーザーにAIを搭載したスクリーンシェアリングアシスタントを無料で展開しました。リリースは、AIを単純なチャットボットから、2つのオープンアプリケーションを介して視覚的にコンテンツを視覚的に分析および対話できるように視覚的に分析して対話できる深く統合されたシステム全体のツールに根本的に変換します。 the company stating in its official announcement that the goal is to make the AI a true “everyday 仲間。”アシスタントがユーザーが見ているものを確認できるようにすることで、リアルタイムのコンテキストヘルプを提供できます。アクセシビリティを広げる重要な更新では、機能は完全に無料になり、以前のより限られたテスト段階からの変更です。以前は一部のテスターに​​必要だったCopilot Proサブスクリプションは、もはや必要ありません。

ユーザーにとって重要性は、この新しいインタラクティブ支援の層にあります。この機能には、タスクを完了するためにクリックする場所をユーザーに視覚的に指示し、ソフトウェア内の段階的なガイダンスを効果的に提供できる画面上の「ハイライト」が含まれています。パッシブAIからアクティブなクロスアピニックパートナーへのこのシフトは、MicrosoftのWindowsオペレーティングシステムのコアに人工知能を埋め込むというMicrosoftの戦略の主要なステップを示しています。すべての人に無料のプレビュー

Copilot Visionの公開の発売は、ニッチな実験から幅広い展開までの慎重に管理された進化の頂点です。この旅は、2024年後半にエッジブラウザーに限定された初期テストで始まり、ユーザーが有料のCopilot Proサブスクリプションを持たせる必要がありました。以前のレポートで詳述されているこの初期バージョンは、可能性を垣間見ることができましたが、ブラウザに限定されたままでした。

4月に、この機能はWindowsインサイダーに展開され、ユーザーの画面上の任意のアプリケーションで動作するブラウザから解放されました。このプレビューは、Windows Insiderブログの発表で最初に明らかにされたもので、AIをオペレーティングシステム自体にもっと深く埋め込むというMicrosoftの意図を明確に示していました。完全な公開リリースはこの遷移を完成させ、高度なクロスアプリケーション機能を米国のすべての人が利用できるようにし、コアウィンドウ機能としてのステータスを固めます。 アプリ。そこから、ユーザーは1つまたは2つのアプリケーションのビューを同時に共有することを選択して、AIがコンテキストを獲得し、それらの間に情報を接続できるようにすることができます。 Copilot Visionには、AIが画像編集ソフトウェアの写真リフレクションを削除し、人気のあるソフトウェアアプリケーションのインターフェイスを介してユーザーをガイドするためにユーザーをガイドできるため、実用的なユーティリティがあります。この機能は、画面の側面にドッキングするリフレッシュされたCopilotインターフェイスの一部です。 Visionに加えて、Microsoftは「ファイル検索」機能をテストしています。これにより、Copilotは、PDF、スプレッドシート、ドキュメントなどのローカルファイルに含まれる情報を見つけて回答することができます。 Windows Recall機能をめぐる論争をきっかけに潜在的な懸念に対処するため。ユーザーは、画面に表示されているものを確認または分析するために、アシスタントと特定のウィンドウを共有することを積極的に選択する必要があります。 このオプトインモデルは、他のAIシステムのより受動的で常に発生したデータキャプチャとはまったく対照的です。

このプライバシー中心のアプローチは、ますます混雑するAI市場におけるMicrosoftの戦略の重要な部分です。同社は、分析されたすべてのコンテンツが短命であることを強調しており、スポークスマンは、アシスタントが関与するコンテンツがトレーニングに保存または使用されておらず、セッションが終了するとすぐに削除されていることを確認しています。 

これは、Microsoftのライバルに対する回答として発売を位置づけ、GoogleのGemini Liveのようなシステムと直接競争します。 Copilot Visionは、実験的なコピロットラボプログラム内でまだ洗練されています。microsoftは最新のAIイノベーションをテストします。 Microsoftが何年も開発してきたビジョン言語モデル。このようなツールの基礎は、2024年6月にフィレンツェ-2モデルの発表でプレビューされました。この技術は効率の大幅な飛躍を表しています。統一された迅速なアーキテクチャにより、キャプションやオブジェクト検出などの多様なタスクを以前に必要とする多様なタスクを処理することができます。視野のより広い分野は依然として大きなハードルに直面しており、2024年10月からの最近の研究では、基本的なパターン認識と推論が必要な視覚的なパズルに苦労していました。このコンテキストでは、副操縦士ビジョンは実際のAI支援における大きな前進を表しているが、基礎となるテクノロジーは依然として積極的な開発と改良の道にあることを強調しています。これは、WindowsオペレーティングシステムのコアユーティリティとしてのAIの戦略的な再配置です。マイクロソフトは、強力で応用のアシスタントを広く自由に利用できるようにすることで、パーソナルコンピューティングの将来に対するビジョンに賭けています。その成功は、ユーザーがAIの「日常のコンパニオン」のこの新しいパラダイムを受け入れ、プライバシーファーストである競合他社のより統合されているが透明性の低いモデルよりも信頼できるかどうかにかかっている可能性があります。

Categories: IT Info