クエリだけでなく、コンピューターを積極的に操作できるAIのハイテク業界の追求は、AIスタジオ内の「コンピューター使用」機能をGoogleが探索することを示しているため、別の潜在的な参入者を見ています。 href=”https://www.testingcatalog.com/google-testss-computer-use-tools-and-cloud-run-hosting-in-ai-studio/”target=”_ blank”> 5月5日に簡単に登場するコードトレースでヒントしたコードトレースでヒントします。 Microsoft、Anthropic、Openaiなどの競合他社とすでにアクティブなフィールド。コードの目撃に伴うシステムメッセージとして、「Gemma 3はGCPプロジェクトでクラウドランサービスとして展開される」と述べた、軽量のGemma 3モデルが軽量化されています。 SDKを更新して、クラウドランエンドポイントを指すようにします。”
このような統合により、開発者はAIスタジオを使用して、コンテナ化されたGemmaインスタンスを比較的簡単に展開できます。 href=”https://cloud.google.com/blog/products/ai-machine-less-with-ai-with-gemma-3-on-cloud-run?ref=testingcatalog.comモデルは、効率のために設計されたGoogleのオープンで軽量モデルであり、多くの場合、単一のGPUまたはTPUで実行できます。頂点AIおよびGoogle Kubernetesエンジン(GKE)は、サポートされている展開ターゲットとして。
ドキュメントは、VLLMやOllamaなどのフレームワークを使用してGemmaをパッケージ化し、公開HTTPSエンドポイントを公開する方法を示す既存のチュートリアルを示しています。このようなコントロールを統合することで、AIスタジオにオーケストレーションレイヤーとローカル実行サンドボックスを提供すると、いくつかのタスクがオンデバイスを実行できますが、より要求の厳しい計算がリモートで処理され、開発者向けのライブAPIの間の距離が短縮される可能性があります。 Gemini 2.0を使用した初期の研究プロトタイプ「Project Mariner」は、 Googleは、Marinerが単一のエージェントのセットアップとして、「WebVoyagerで83.5%の最先端の結果を達成した」と述べた。 AI Studioプラットフォーム自体は、5月3日以降のGemini 2.5 Proの統合やスクリーン共有機能などの機能を備えた進化しており、より高度なエージェントツールの論理的なホームになりました。 Microsoftは、4月にCopilot Studioで「コンピューター使用」機能のプレビューを開始し、AIがデスクトップやWebアプリで人間のアクションをシミュレートできるようにすることでエンタープライズオートメーションをターゲットにしました。 Microsoftのビジネスおよび産業副社長のCharles Lamannaは、当時「人がアプリを使用できる場合、エージェントもできる」と述べました。 AsanaやDoordashなどの初期の採用者は、これをマルチステッププロセスに使用したと伝えられていますが、この機能は実験的であり、時には起動時にエラーが発生しやすいと説明されていました。 2月までに、Openaiはオペレーターの可用性を拡大しました。 「Theagentcompany」というタイトルの5月5日に発行されたカーネギーメロン大学の研究は、地味な評価を提供しました。ソフトウェア会社をシミュレートするこの調査では、AIの主要なAIであるAnthropicのClaude 3.5 Sonnetでさえ、割り当てられたタスクの24%しか完成していないことが、タスクあたり6ドルを超える運用コストで完全に完了しました。 GoogleのGemini 2.0 Flashは11.4%の完了を管理しましたが、OpenaiのGPT-4oは8.6%を達成しました。たとえば、エージェントは基本的なファイルの理解または単純なオンスクリーンポップアップの却下に苦労しました。
この調査では、おそらくトレーニングに利用できるパブリックコードの大規模なコーパスのために、管理または財務の役割と比較してソフトウェア開発タスクのパフォーマンスが向上しました。結論は、AIエージェントは人間の仕事の一部を支援できるが、「現時点ではすべてのタスクに代わるものではない可能性が高い」ということでした。これは、Googleからの新しい「コンピューター使用」機能が暗黙的に測定されるという顕著なパフォーマンスベンチマークを提示します。中国のスタートアップバタフライエフェクトからのマヌスAIは3月6日頃に発売され、人間の監視なしで一定の人間の監視なしでデジタルタスクを計画および実行できる自律エージェントとして販売されており、人類のクロードやアリババのQwenなどのモデルを使用していると伝えられています。エージェントは、セキュリティとプロパガンダの懸念により、マヌスAIがテネシー州とアラバマ州の州ネットワークに禁止されているため、規制当局からすぐに注目を集めました。 href=”https://www.fiercehealthcare.com/health-tech/google-cloud-cloud-cloud-cloud-cloud-agent-ai-systems-next-frontier-advancing-tools-build-and-manage”ターゲット=”_ blank”> google cloud 2025年4月。GoogleがAI Studioの「コンピューター使用」機能を潜在的に準備する可能性があるため、その成功は、Gemma 3などのモデルの技術的能力と展開の容易さだけでなく、AI駆動型コンピューター操作の分野でますます顕著になっている信頼性と安全性に関する考慮事項にも依存します。ホスティングは、AIスタジオをGemmaおよび将来のモデルで開発するためのより包括的なプラットフォームに変える可能性があります。この「コンピューターの使用」機能が広く船の船であるか、内部実験のままであるかは、これらの進行中の安全評価とGoogleの進化するエージェント戦略に依存する可能性があります。