Google は、有料の Gemini Advanced サブスクリプション内で Gemini 1.5 Pro をリリースし、プラットフォームに多数の新機能をもたらしました。 Google I/O 2024 中のアップデートには、100 万トークンから始まる長いコンテキスト ウィンドウ、改善されたコード生成、論理的推論、マルチターン会話、強化された音声と画像の理解が含まれます。

Gemini Advanced Gemini 1.5 Pro では

Gemini Advanced は、最大 1,500 ページまでの複数の大きなドキュメントを処理したり、100 件の電子メールを要約したりできるようになりました。ユーザーは、Google ドライブ経由で、または自分のデバイスから直接ファイルをアップロードして、密度の高いドキュメントに関する洞察を得ることができます。 Google は、ユーザー ファイルは非公開のままであり、モデルのトレーニングには使用されないことを強調しています。

今後の機能により、ユーザーはスプレッドシートやその他のデータ ファイルをアップロードして理解できるようになり、分析やカスタム ビジュアライゼーションが可能になります。この機能は Google スプレッドシート、CSV、Excel ファイルをサポートしており、今後数週間以内に公開される予定です。

[埋め込みコンテンツ]

Gemini 1.5 Pro では画像の理解も向上し、ユーザーは次のことを可能にします。料理の写真を撮ってレシピを取得したり、数学の問題の写真を撮って段階的な指示を得ることができます。さらに、間もなく 1 時間のビデオ コンテンツや 30,000 行を超えるコードベースを処理できるようになります。

Gemini 拡張機能

Google は Gemini 拡張機能には、Google カレンダー、Tasks、Keep、時計アプリなどのその他のユーティリティが含まれます。たとえば、ユーザーは印刷されたスケジュールの写真を撮り、Gemini にカレンダー イベントを作成させることができます。

ユーザーがお気に入りの詩や注目のアーティストに言及して曲を検索できる YouTube Music 拡張機能も本日リリースされます。 。これらの新しい拡張機能は、Gmail、ドライブ、ドキュメント、Google フライト、ホテル、マップ、YouTube の既存の拡張機能に加わり、無料と有料の両方の Gemini ユーザーが利用できます。

カスタム Gemini’Gems’

今後数か月以内に、Gemini Advanced ユーザーとビジネス顧客は、「Gem」、つまり Gemini のカスタマイズされたバージョンを作成できるようになります。これらは、ジムの仲間、副料理長、副料理長など、さまざまな役割を果たすことができます。コーディング パートナー、クリエイティブ ライティング ガイドなど、ユーザーが希望する Gem の機能と個性を説明すると、Gemini がその指示に基づいて作成します。

ラーニング コーチのような既製の Gem は、すべての Gemini ユーザーが利用できます。

Gemini Advanced 用イマーシブ プランナー

Gemini Advanced は間もなく Web 上に「イマーシブ プランナー」を搭載し、カスタム、タイムラインベースの旅程。この計画ツールは、Gmail からのフライト情報、Google マップからの地元のおすすめ情報、その他のアクティビティを統合し、それらを動的 UI に表示して簡単に編集できるようにします。

開発者向けアップデート: Gemini 1.5 Flash および Gemma 2

Google は、最速かつ最も汎用性の高いマルチモーダル AI である Gemini 1.5 Flash も導入しました。モデル。同じ 100 万のコンテキスト ウィンドウを備え、要約、チャット アプリケーション、データ抽出などの低遅延でコスト効率の高いユースケース向けに設計されています。 Flash は Gemini Nano、Pro、Ultra などの他のモデルに加わり、Google AI Studio の Gemini API を通じて利用できます。 p>

Google は、Gemini 1.5 Pro の 200 万コンテキスト ウィンドウもプレビューしており、並列関数呼び出しやネイティブ ビデオ フレーム抽出などの機能を追加しています。コンテンツのアイデアのブレーンストーミングや複雑なドキュメントの分析などのシナリオに最適なコンテキスト キャッシュ機能が間もなく利用可能になります。

さらに、Google は Gemma 2、より大きなモデルよりも優れたパフォーマンスを発揮し、単一の TPUv5e で実行される 27B パラメータ モデル、および PliGemma は、多用途で軽量なビジョン言語モデル (VLM) です。同社はまた、第 6 世代 TPU「Trillium」も発表しました。 TPU v5e と比較して、チップあたりのピーク コンピューティング パフォーマンスが大幅に向上しています。

サブスクリプションと可用性

Gemini Advanced サブスクリプションは、月額 20 ドルかかります。 2 か月の無料トライアルは現在 35 言語以上、150 か国で利用可能です。Google は今年後半に 200 万トークンを Gemini Advanced に提供し、より大きなファイルやより複雑なタスクの処理能力を強化する予定です。

Categories: IT Info