Microsoftは、2D画像から直接3Dモデルを生成する新しい実験機能であるCopilot 3Dを発売しました。 2025年8月8日にリリースされたこのツールは、 copilotラボのWeb のCopilot Labsを介して

プロセスは簡単です。ユーザーはPNGまたはJPGファイルをアップロードし、AIは3次元オブジェクトを構築しようとします。このツールは現在、この画像から3Dパイプラインのみをサポートしており、テキストプロンプトからモデルを生成しません。同社の目標は、従来の障壁を排除することです。公式発表で、Microsoftは、「Copilot 3Dは3D Creationをよりアクセスしやすくします。単一の画像でアイデアを3つの次元に形作ることができます。急な学習曲線はありません。威圧的なソフトウェアのビジョンを強調しています。 verge のようなアウトレットから

AIは、より複雑で有機的な被験者に直面した場合、著しく苦労しています。動物と人間は特に挑戦的であることが証明されており、しばしば歪んだ奇妙なモデルをもたらします。この制限は、ペット犬を含む広く共有されたテストで鮮明にキャプチャされました。私の犬がペニスを持っていると推測しようとしたように見えます(彼はそうします)、そしてその陰茎を背中に置くことにしました。」このコミカルな失敗は、テクノロジーの初期の状態を強調しています。

AIは2D画像から基本的な形状を解釈することができますが、リアルなオーガニックフォームに必要な微妙な解剖学的理解が欠けているため、シンプルなオブジェクトの迅速なプロトタイプに最適です。 Copilot 3Dは、ますます AI-driven 3Dコンテンツ生成にアクティブで競争力のある市場に配置します。他のいくつかの主要なハイテク企業が独自のソリューションを開発しており、それぞれがこの複雑な課題に取り組むためのユニークなアプローチを備えています。最新のモデルであるAssetGen 2.0は、テキストと画像プロンプトの両方から高品質の3Dアセットを生成し、前身を大幅に飛び越えます。メタの代表者であるジョエル・ヘシュは、「今日のAssetGen V2のスニークピークを共有することを共有している。想像できるあらゆるタイプの3Dモデルを作成できるようにすることで大きな進歩を遂げている」と述べて、進歩に対する興奮を共有しました。これは、Copilot 3Dの現在のイテレーションからのより実験的な「十分な」出力とは対照的です。一方、Gaming Giant Robloxは、Cube 3Dモデルでオープンソースルートを撮影しました。このシステムは、3Dシェイプをテキストプロンプトからオブジェクトを構築するために3D形状を独自にトークン化します。これは、言語モデルが単語を処理する方法と同様の方法です。ツールをオープンソーシングすることにより、Robloxは幅広い開発者コミュニティを促進することを目指しています。

同社はその進化のための野心的な計画を持っています。 Robloxは、「最終的には、テキスト、画像、ビデオ、およびその他の種類の入力で訓練されたマルチモーダルモデルになります。」と述べています。このコミュニティに焦点を当てた戦略は、Microsoftのプラットフォーム統合アプローチとは大きく異なります。その安定した高速3Dモデルは、1秒未満で単一の画像から3Dアセットを生成することができ、以前のテクノロジーよりも劇的な改善です。この分野におけるこの豊かな革新の歴史は、2023年5月にリリースされたOpenaiのShap・Eのようなツールに遡ります。何十年もの間、3Dモデルの構築は、専門的なスキルと高価で複雑なソフトウェアを必要とする労働集約的なプロセスでした。 AIはそれを変えることを約束し、潜在的に産業をゲームや映画から建築、eコマースに革命を起こすことを約束します。

無料で使いやすいツールをCopilotに直接埋め込むことで、Microsoftは大量採用のために明確な遊びをし、3D世代をカジュアルな日常的な仕事にすることを望んでいます。このアプローチは、Horizon WorldsおよびRobloxのコミュニティ主導のオープンソースの取り組みに対するMetaの壁に覆われた戦略とは対照的です。

各企業は、そのプラットフォームが次世代のクリエイターの頼りになる出発点になると賭けています。ただし、Copilot 3Dなどのツールの究極の影響は、実際のパフォーマンスと信頼性に完全に依存します。技術は急速に進歩していますが、初期のテストからの面白い欠陥のある結果は、まだ長い道のりがあることを示しています。

Categories: IT Info