Googleは、最新のAIリリースで「より少ない」哲学を受け入れており、Hyper効率の高いGemma 3 270Mオープンモデルを開始しています。 このコンパクトモデルは、わずか2,7000万のパラメーターを備えており、開発者がスマートフォンなどのデバイスで直接実行できる専門的で微調整されたアプリケーションを作成するために設計されています。 Gemma 3 270mは、大規模なクラウドベースのシステムに依存する代わりに、明確に定義されたタスクの極端な電力効率に焦点を当てており、高度なAIがオンデバイスおよびエッジコンピューティングでよりアクセスしやすくなります。ターゲット=”_ blank”>オープンモデルの「ジェマバース」の拡大。 3月のGemma 3シリーズの最初のデビュー、4月の消費者GPUのQATバージョンのリリース、および6月にモバイルファーストGemma 3nの発売に続きます。 src=”data:image/svg+xml; nitro-empty-id=mty0nzoxmdu3-1; base64、phn2zyb2awv3qm94psiwidagmti4mca3mj aiihdpzhropsixmjgwiibozwlnahq9ijcymcigeg1sbnm9imh0dha6ly93d3cudzmub3jnlziwmdavc3znij48l3n2zz4=”>

この戦略は、より広範な業界のシフトと小規模言語モデル(SLM)に合わせています。 MicrosoftのようなPHIシリーズ、Small 3モデルを備えたミストラルAI、Smolvlmモデルの抱き合っている企業はすべて、効率的なAIに多額の投資を行っています。小規模で専門的なモデルが実用的で現実世界の展開に不可欠なツールになりつつある成長する業界のトレンドを強調しています。 href=”https://developers.googleblog.com/en/introducing-gemma-3-270m”ターゲット=”_ blank”> GoogleはGemma 3 270m 大規模で一般的なモデルのライバルとしてではなく、Lean Systemsを獲得するための高品質の基礎としての基礎としての基礎としての基礎としての基礎としての基礎として位置付けられています。同社の公式発表は、古典的なエンジニアリングの原則を呼び起こします。額縁を掛けるためにスレッジハンマーを使用することはありません。このモデルこの「仕事のための正しいツール」哲学を編成します。速度と費用対効果が最も重要な明確な機能。 Googleは、感情分析、エンティティ抽出、クエリルーティング、クリエイティブライティング、コンプライアンスチェック、構造化データへの変換などの理想的なユースケースを特定します。目標は、開発者が複数のカスタムモデルを構築および展開できるようにすることです。それぞれが、より大きなシステムに関連する法外なコストなしに、異なるタスクのために巧みに訓練されています。 Googleは、SK Telecomを使用したAdaptive MLの作業を強調しています。ここでは、微調整されたGemmaモデルに微妙な多言語コンテンツモデレートが課せられています。結果は厳しいものでした。特殊なモデルは、その特定のタスクではるかに大きな独自のシステムを満たしただけでなく、上回っていました。このサクセスストーリーは、開発者がGemma 3 270mの効率を活用する方法の実用的な青写真として機能します。

コンパクトで有能なベースから始めて、開発者はより速く劇的に安価な生産システムを構築できます。この戦略は、大規模な推論コストを負担することなく大規模に展開できる費用対効果の高いAIの必要性の高まりを直接標的にします。モデルの小さなサイズにより、迅速な反復が可能になり、数日ではなく数時間で微調整実験が完了することができます。ロールプレイングゲームNPCやカスタムジャーナリングボットなどの特定の高度に専門化された役割の場合、オーバーフィッティングを通じて一般的な知識を「忘れる」モデルの能力が機能になり、指定された機能にレーザーに焦点を当てたままにしておくことができます。洗練された技術的なパンチ、意図的な建築トレードオフの結果。モデルの2億7,000万のパラメーターは型破りに分散されています。かなりの1億7,000万がその埋め込み層に専念しており、コアトランスブロックにわずか1億を残しています。この設計の選択により、モデルの傑出した機能、つまり256,000トークンの大量の語彙が直接可能になります。

この大きな語彙は、その専門能力の鍵です。これにより、モデルは忠実度の高い希少、具体的、技術的なトークンを処理できるようになり、法律、医学、金融などのニッチドメインで微調整するための非常に強力な基盤となります。最初から業界固有の専門用語を理解することにより、専門家になるにはより少ないトレーニングデータが必要です。これは、立派な32Kトークンコンテキストウィンドウによって補完され、実質的なプロンプトとドキュメントを処理できるようにします。

即時のユーザビリティを確保するために、Googleは事前に訓練されたチェックポイントと命令チューニングチェックポイントの両方をリリースしています。同社は、Gemma 3 270Mがチャットボットのような複雑でオープンエンドの会話のユースケース用に設計されていないことを明らかにしています。代わりに、命令チューニングバージョンは、構造化されたプロンプトとコマンドを箱から出して効果的に追跡するように設計されており、さらにカスタマイズするための信頼できるベースを提供します。

この堅牢なデザインは、業界のベンチマークでのパフォーマンスによって検証されます。検証可能な指示に従うモデルの能力を測定するIFVALテストでは、Gemma 3 270mは51.2%のスコアを達成します。このスコアは、より多くのパラメーターを持つ他の軽量モデルよりも高く、重量をはるかに上回ることを示しています。予想通り10億パラメーターモデルに達していませんが、そのパフォーマンスは分数サイズに対して非常に競争力があります。 Pixel 9 Proの内部テストでは、25の会話にデバイスのバッテリーのわずか0.75%を使用しているInt4 Quantizedモデルが示され、Googleの最も電力効率の良いGemmaモデルになりました。また、機密情報をクラウドに送信することなくローカルで処理できるため、ユーザーのプライバシーが保証されます。これにより、開発者は、リソースに制約のあるハードウェアに展開するための重要な機能である最小限のパフォーマンス劣化でINT4精度でモデルを実行できます。

開発者にとって、Gemma 3 270mはhref=”https://huggingface.co/collections/google/gemma-3-release-67c6c6f89c4f76621268bb6d”ターゲット=”_ blank”> face 、ollama、caggle in caggle ing face and face 、ollama、caggle in face intex aに以前のGemmaリリースを「あらゆるモデルで見た中で最も包括的な初日の発売」と呼んだSimon Willisonのような開発者によって称賛されたこの幅広いアクセシビリティは、これらのより小さく、より実用的なAIツールの周りに活気のある生態系を育てる鍵です。

Categories: IT Info