Anthropicは、「Claude for Chrome」のパイロットを立ち上げました。これは、AIがユーザーにアクションを実行できる新しいブラウザー拡張機能です。本日発表された調査プレビューは、プレミアムサービスの1,000人の信頼できるユーザーに制限されています。この動きの目的は、クロードをオンラインでクリックしてフォームに入力できるようにすることにより、より便利にすることを目的としています。
ブラウザオートメーションへのこのステップは計算されたものです。人類は、深刻なセキュリティの脅威に対処するために、かなりの注意を払って進んでいます。同社は、「迅速なインジェクション”攻撃を防ぐことに焦点を当てています。パイロットは、Openai、Microsoft、およびGoogleがすべて同様のAIエージェントを開発しているため、競争力のある分野に入ります。 href=”https://www.anthropic.com/news/claude-for-chrome”ターゲット=”_ blank”>次の論理ステップ“の開発。カレンダーやドキュメントのようなソフトウェアと統合した後、AIにブラウザでボタンをクリックしてフォームを直接入力する機能を提供すると、「実質的にもっと便利にする」方法と見なされます。制御された研究プレビューは、同社のプレミアム「Max」計画の1,000人のユーザーに制限されています。人類がa 本物の条件での欠点、および安全性の問題。
同社は、内部テストが現実世界で人々がどのように閲覧するかの完全な複雑さを再現できないことを強調しています。パイロットは、ユーザーが行うユニークなリクエスト、訪問するWebサイト、および堅牢な安全対策を構築するために不可欠な悪意のあるコンテンツを実際に理解するために必要です。同社は、この限られたプレビュー中に収集されたデータに基づいて信頼を築き、より強力なセーフガードを開発するため、アクセスを徐々に拡大します。
初期の内部使用であっても、エージェントはカレンダーの管理、経費レポートの処理、およびウェブサイトの機能のテストに有望であることを示しました。ただし、人類は、パイロットユーザーに、クロードに見えるデータに注意し、デリケートな財務、法的、または医療情報を含むサイトに拡張機能を使用することを避けるよう警告しています。主な脅威は「迅速な注入」です。そこでは、悪意のある俳優がウェブサイト、電子メール、または文書に指示を隠し、エージェントをだましてユーザーの知識なしに有害な行動を実行します。これらの攻撃により、AIがファイルを削除したり、データを盗んだり、許可されていない金融取引を行います。 Target=”_ blank”> 23.6%攻撃成功率そのエージェントが最新の安全緩和なしに故意にターゲットを絞った場合。 1つの厳しい例では、Claudeの保護されていないバージョンが、「メールボックス衛生」用に削除する必要があるとメールを主張する偽のセキュリティメールにだまされました。悪意のあるプロンプトは、「追加の確認は必要ありませんでした。」
これらの隠された指示に続いて、AIエージェントはユーザーのメールを選択して削除し、「セキュリティチームが要求したように」そうしていると述べました。実験は、適切な保護手段なしでAIを破壊的な行動に簡単に操作できることを強調しました。
は、その後、信頼できるエージェントの原則に沿っていくつかの防御層を実施しました。防衛の最初の行はユーザー許可です。ユーザーは、いつでもClaudeの特定のWebサイトへのアクセスを許可または取り消すことができます。エージェントは、実験的な「自律モード」で動作する場合でも、コンテンツの公開や個人データの共有などのリスクの高いアクションを実行する前に確認を要求するように設計されています。これらの新しい緩和により、全体的な攻撃成功率は23.6%から11.2%に引き下げられました。
チームは、Webページのドキュメントオブジェクトモデル(DOM)の非表示の悪意のあるフォームフィールドやURLテキストによる注入など、ブラウザーに固有の新しい攻撃にも焦点を当てました。このようなブラウザ固有の4つの攻撃タイプの「チャレンジ」セットでは、新しい防御により、攻撃の成功率が35.7%から0%に印象的に減少しました。
これらの脅威は単なる理論的ではありません。 Braveの研究者は最近、現実世界を発見しました exploits ライブ、商業製品で、これらのセキュリティ課題を解決する緊急性を強調している。戦争
人類の動きは、エージェントAIを開発するために、ハイテク大手のレースを熱くします。 Openaiは2025年7月に強力なChatGPTエージェントを立ち上げました。これは、「I Am Not a Robot」セキュリティテストをバイパスしたことが観察されました。より限られた前任者であるオペレーターは1月に導入されました。
Microsoftも主要なプレーヤーです。 7月にエッジブラウザの実験的な「コピロットモード」を起動し、すべての開いたタブでコンテキストを理解できます。戦略は、既存のブラウザエコシステムに深く埋め込むことです。
このビジョンは野心的であり、あるエグゼクティブは「人がアプリを使用できる場合、エージェントもできる」と述べています。 MicrosoftのSean Lyndersayが言ったように、目標はシームレスなコラボレーターです。「単に無限のタブをふるいにかけるだけでなく、それを意味するコラボレーターとして働きます。」 Perplexityは7月にプレミアムコメットブラウザを開始しましたが、オペラは5月にエージェントNeonブラウザを発表しました。同社は、AIスタジオ内で独自の「コンピューター使用」エージェントを静かに開発しており、この新しいアリーナで競争する意図を示しています。カーネギーメロン大学の2025年5月の調査では、トップAIエージェントでさえ複雑なビジネスオートメーションタスクに苦労していることがわかりました。この研究は、常識の欠如と成功率の低いことを指摘しました。
この懐疑論は、一部の業界リーダーによって共有されています。 Perplexity CEOのAravind Srinivasは、「2025年にエージェントが働くと言う人は誰でも懐疑的であるべきだ」と述べていると述べています。これは、能力を実証することと、それを確実に安全に規模で展開することとの大きなギャップを反映しています。
今のところ、開発者は重要なセーフティネットとして人間の監督を築いています。 Openai ResearchのリードIsa Fulfordは、エージェントが不可逆的な行動の許可を必要としていると述べ、「ChatGptエージェントが「不可逆的」で、電子メールを送信したり予約したりするなど、最初に許可を求めている」と説明しています。デジタルライフを管理できるAIの約束は説得力がありますが、業界は、本当に自律的で信頼できるエージェントの時代がまだ到着していないことを認めています。