Google I/O 2024 開発者カンファレンスで、Google は、Gemini Nano AI モデル をこの動きは、開発者がオンデバイス モデルを利用して独自の AI 機能を強化できるようにすることを目的としています。 Google は、この機能を Workspace Lab の一部である Gmail の「書き込みヘルプ」ツールなどの機能に活用する予定です。

Google の Gemini Nano は、Google DeepMind12 によって開発された Gemini エコシステムの一部です。このモデルは、データ ネットワークの有無にかかわらず、デバイス上で迅速な応答を提供するために最適化されており、画像の理解、音声の書き起こし、テキストの要約などのタスクを実行するように設計されています。

AI 機能による Chrome の強化

strong>

WebGPUWebAssembly (WASM) サポートにより、これらの AI モデルをさまざまなハードウェアで効率的に実行できるようになりました。Google の Chrome 製品管理ディレクターである Jon Dahlke 氏は次のように述べています。同社は同様の機能を実装するために他のブラウザ ベンダーと協議中です。

「私たちは他のブラウザとの連携を開始しており、開発者向けに早期プレビュー プログラムを公開する予定です」と Dahlke 氏は述べました。 「WebGPU、WASM、Gemini が Chrome に組み込まれているため、Web は AI に対応できると考えています。」

Google は、Chrome でさまざまな高レベル API を使用してテキストの翻訳、キャプション、文字起こしを可能にすることを目指しています。 「この機能を提供するために、私たちは最も効率的なバージョンの Gemini と最適化された Chrome を微調整しました」と Dahlke 氏は開発者基調講演で述べました。 「私たちのビジョンは、迅速なエンジニアリング、微調整、容量、コストを心配することなく、Chrome で最も強力な AI モデルを提供し、数十億人のユーザーにリーチすることです。」

[埋め込みコンテンツ]

開発者ツールと新機能

Pixel 8 Pro 以降の Pixel 8 に導入された軽量の大規模言語モデルである Gemini Nano は、微調整され最適化されています。この統合により、ユーザーはブラウザ内で製品レビュー、ソーシャル メディア投稿、その他のコンテンツを直接生成できるようになります。 DevTools コンソールは、組み込みの Gemini Nano モデルを使用してエラーを説明し、デバッグ ソリューションを提供するようになりました。

Microsoft Edge との比較

Google の動きこれは、Microsoft が昨年、AI アシスタントである Copilot を Edge ブラウザに統合したことを反映しています。ただし、デバイス上でローカルに実行される Chrome の Gemini Nano とは異なり、Edge の Copilot はクラウドベースのサーバー上で動作します。

Gemini Nano の Chrome への統合は、開発者やエンドユーザーが AI 機能をより利用しやすくするための重要な一歩を表しています。 Google は、AI をブラウザに直接組み込むことで、開発プロセスを合理化し、アプリケーション全体のユーザー エクスペリエンスを向上させることを目指しています。

Categories: IT Info