Google は、一連のアップデートと新機能 I/O 2024 イベント中に、人工知能 (AI) の進歩に重点を置きました。このイベントでは、Google の Gemini AI モデルの Workspace や Chrome などのさまざまなアプリケーションへの統合が紹介され、いくつかの新機能が紹介されました。
強化された Google レンズと写真の統合
Google レンズはビデオベースの検索をサポートするようになり、ユーザーがビデオを録画し、録画中に質問し、Google の AI を通じてウェブから関連する回答を受け取ることができるようになりました。さらに、「Ask Photos」と呼ばれる新機能により、Gemini AI はユーザーの Google フォト ライブラリを分析できるようになります。この機能は、ナンバー プレート番号の識別など、写真に関する特定のクエリに答え、検証用の対応する画像を提供できます。
Gemini AI モデルの進歩
Google は、Gemini 大規模言語モデルにいくつかのアップデートを導入しました。たとえば、タスク用に最適化された Gemini 1.5 Flash モデルの発表です。このモデルは、Gemini 1.5 Pro に匹敵する能力を備えており、高頻度で低レイテンシのタスクに優れています。Gemini 1.5 の機能強化には、翻訳、推論、コーディング機能の向上と、1 からのコンテキスト ウィンドウの増加が含まれます。 Gemini 1.5 Pro モデルは Google Workspace アプリケーションに統合され、Google Meet の録画を要約したり、他のドキュメントからの情報を組み込んでメール作成を支援したりする機能を提供します。
[埋め込みコンテンツ]
新しい AI ツールと機能
Google の Project Astra は、デバイスのカメラからの視覚入力を理解し、それに基づいて動作できるマルチモーダル AI アシスタントの作成を目指しています。このプロジェクトは、I/O 2024 での革新的なデモンストレーションの多くを支えています。さらに、Google は、テキスト、画像、ビデオ プロンプトから 1080p ビデオを作成するための生成 AI モデルである Veo を導入しました。 Veo は現在、一部の YouTube クリエイターが利用でき、映画業界にも販売されています。
新しい「Gems」機能を使用すると、ユーザーはモチベーションを高めるランニング コーチなど、特定のニーズに合わせたカスタム チャットボットを作成できます。Gemini Live AI との音声対話が強化され、会話がより自然になり、Google カレンダー、タスク、Keep との統合により、Gemini の機能がさらに拡張されます。
AI による機能強化。 Android および Chrome
Android デバイスは、Gemini Nano AI を利用して不審な通話パターンを特定し、リアルタイムで警告を発する AI を活用した詐欺検出の恩恵を受けることができます。将来のアップデートにより、ユーザーはビデオをクエリできるようになります。有料の Gemini Advanced ユーザーは、PDF から情報を抽出することもできます。
Google は、Gemini AI を使用して詐欺電話をリアルタイムで検出する新しいツールを発表しました。 AI は、スパムの可能性のある番号からの通話を監視し、会話中に何か不審な発言があった場合にユーザーに警告します。この機能は、偽の銀行担当者がプレゼンターに電話をかけることでデモンストレーションされました。詐欺師が別の口座への送金を要求すると、AI はそれを詐欺としてフラグを立てました。
AI は、PIN やパスワードなどの機密情報が要求された場合にもユーザーに警告します。この詐欺検出ツールは、AI のもう 1 つの実用的な応用例を示しており、詐欺行為を容易に認識できない脆弱な個人にとって特に有益である可能性があります。この機能は Android 15 では開始されません。Google は今年後半に詳細を提供する予定であり、ユーザーがオプトインする必要があることを確認しました。セキュリティを確保するために、処理はデバイス上で処理されます。