Google DeepmindはGemini RoboticsとGemini Robotics-ERを導入しました。2つの高度なAIモデルは、ロボットが最小限のトレーニングで物理的なタスクを学び、適応する方法を強化するために開発されました。彼らの打ち上げは、進化するAIモデルセクターにおける現実世界の相互作用能力への焦点の拡大を反映しています。 href=”https://deepmind.google/discover/blog/gemini-robotics-brings-ai-into-the-physical-world/”> gemini robotics 視覚認識、自然言語理解、およびロボットを実現するためのアクション学習を組み合わせて、複雑な環境を処理すること、
モデルは、ゼロショットと少数のショット学習アプローチを採用しているため、ロボットは事前のトレーニングなしでタスクを処理したり、最小限の例から迅速に適応したりできます。このアプローチは、トレーニングサイクルを最小限に抑え、ロボットシステムの迅速な展開を促進することにより、製造やロジスティクスなどの業界を支援できます。このモデルを使用したロボットは、3D環境を分析し、オブジェクトの軌跡を予測し、オブジェクトが空間内で相互作用する方法を理解することができます。
結果は、動作性の精度を維持しながら動的で予測不可能なシナリオに適応できるシステムです。さまざまな運用コンテキストにわたる適応性にあります。これらのモデルを利用するロボットは、タスク間で移行したり、再プログラミングを最小限に抑えて新しい環境に調整できます。
たとえば、製品アセンブリ用に元々構成されていたロボットは、異なる製品ラインのアセンブリを削減し、より速い展開を有効にすることに適応できます。このクロスプラットフォーム機能は、高度なロボット工学を運用に統合する企業のスケーリングプロセスを簡素化し、自動化ワークフロー内の課題に直接対処します。 2024年12月、カーネギーメロン大学はGenesis AIシミュレーターを導入しました。これは、実際の世界条件よりも最大81倍速い複雑なシミュレーションを生成することによりロボットトレーニングを加速します。 (出典: genesis githubページ)
ジェネシスは、単純なテキストプロンプトから動的なシナリオ生成を可能にし、AI-drive Aimodiveを洗練するための低リスクで効率的なアプローチを提供します。ロボットの応答性と適応性。埋め込まれたGPUで完全に動作するHelixを使用すると、ロボットは音声コマンドを理解し、なじみのないオブジェクトに適応し、クラウドシステムに依存してリアルタイムでコラボレーションできます。
[組み込みコンテンツ] 2月のMicrosoftは、Magma AIモデルを発表し、ソフトウェアの自動化をロボット工学の橋渡しに焦点を当てました。マグマは、ビジョン、言語、およびアクションデータを統合して、産業およびエンタープライズ環境でワークフローを自動化し、適応性を高め、運用上の複雑さを低下させます。 src=”data:image/svg+xml; nitro-empty-id=mtczndoxmjc2-1; base64、phn2zyb2 awv3qm94psiwidagmtaynca2mjyi ihdpzhropsixmdi0iibozwlnahq9ijyyniigeg1sbnm9imh0dha6ly93d3cudzmub3jnlziwmdavc3znij48l3n2zz4=”>使用一方、MAGMA AI(出典:Microsoft)
の症例例は、基礎AI技術の提供に焦点を当てています。 2月上旬、同社は、ロボット工学の精度とリアルな動きを改善するように設計されたMeta Motivo AIモデルを導入しました。メタのアプローチは、高度なロボットシステムの構築におけるサードパーティメーカーをサポートしています。 src=”data:image/svg+xml; nitro-empty-id=mtc0mtoxmjcy-1; base64、phn2zyb2awv3qm94psiwidagmtaynca2nzkiihd pzhropsixmdi0iibozwlnahq9ijy3osigeg1sbnm9imh0dha6ly93d3cudzmub3jnlziwmdavc3znij48l3n2zz4=”> screenshot Meta Motivo Interactive Demo
シミュレーションにより、AI開発が速く駆動
シミュレーションは、AI開発の中心的なコンポーネントになり、ロボット行動を改良するための低リスク環境を提供します。 Genesis Emulatorにより、研究者は基本的なテキストプロンプトから現実的なシナリオを作成し、実際の展開前にGemini RoboticsなどのAIモデルの適応を加速できます。これにより、AIシステムは繰り返しシミュレーションを通じてアクションを最適化し、予測不可能な現実世界の条件での動作の改善を確保できます。 Gemini Roboticsの場合、この手法により、多様なタスクと環境全体の適応性と精度が保証されます。
トレーニングアプローチに加えて、リアルタイム処理機能も高度なロボット工学の決定的な要因になりつつあります。図AIのヘリックスシステムは、局所的な意思決定に埋め込まれたGPUを利用し、遅延を減らし、即時の応答性を可能にすることにより、これを例示しています。これは、運用効率に迅速な適応性が不可欠であるロジスティクスのような業界では特に重要です。これにより、ロボットはリアルタイムの環境データに基づいて動作を調整でき、硬直した事前定義された命令の必要性を減らします。
このような適応性は、柔軟性が競争上の優位性である動的環境での展開に不可欠です。 HelixやGemini Roboticsなどのモデルは一般的な適応性を改善できますが、倫理的ジレンマや脆弱または不規則なオブジェクトを使用するタスクは、ロボットの判断、精度、精度をテストし続けています。原則、意図しない行動を最小限に抑え、ロボットが人間の環境と安全に対話できるようにすることに焦点を当てています。