Microsoft uruchomił Copilot 3D, nową funkcję eksperymentalną, która generuje modele 3D bezpośrednio z obrazów 2D. Wydany 8 sierpnia 2025 r. Narzędzie jest dostępne bezpłatnie dla wszystkich podpisanych użytkowników za pośrednictwem

Nowe narzędzie do demokratyzacji tworzenia 3D

Microsoft pozycjonuje COPILOT 3D jako główny krok w kierunku uproszczenia kompleksowych przepisów. Narzędzie znajduje się w Copilot Labs, wyznaczonym gruncie testowym firmy dla funkcji AI na wczesnym etapie. Umieszczenie to sugeruje, że narzędzie nie jest jeszcze uważane za wypolerowaną funkcję gotową do produkcji, ale raczej publiczny podgląd przyszłych możliwości.

Proces jest prosty: użytkownicy przesyłają plik PNG lub JPG, a AI próbuje skonstruować z niego trójwymiarowy obiekt. Narzędzie obecnie obsługuje tylko ten rurociąg obrazowy do 3D i nie generuje modeli z monitów tekstowych.

Powstałe modele można pobrać w formacie GLB, wszechstronnym standardowym kompatybilnym z wieloma widzami 3D, silnikami gier i aplikacjami projektowymi. Celem firmy jest usunięcie tradycyjnych barier wejścia. W swoim oficjalnym ogłoszeniu Microsoft stwierdził: „Copilot 3D sprawia, że tworzenie 3D jest bardziej dostępne. Z jednym obrazem każdy może zacząć kształtować pomysły na trzy wymiary. Brak stromej krzywej uczenia się. Brak oprogramowania zastraszającego.”, Podkreślając swoją wizję dostępnego stworzenia dla wszystkich.

wczesne testy ujawniają obietnicę i szczególne oprogramowanie The Verge Pokaż, że wydajność narzędzia jest obecnie mieszaną torbą. Wydaje się, że Copilot 3D obsługuje dobrze zdefiniowane, nieożywione obiekty z wyraźnym oświetleniem i tłem z względnym sukcesem. Testerzy zgłaszali przyzwoite wyniki podczas konwersji obrazów mebli IKEA.

AI zmaga się jednak, jednak w obliczu bardziej złożonych osób organicznych. Zwierzęta i ludzie okazały się szczególnie trudne, często powodując zniekształcone i dziwne modele. To ograniczenie zostało żywo uchwycone w jednym powszechnie wspólnym teście z udziałem psa dla zwierząt domowych.

Jako Tom Warren z The Verge Humororyly

Podczas gdy AI może interpretować podstawowe kształty z obrazu 2D, brakuje jej dopracowanego anatomicznego zrozumienia potrzebnego dla realistycznych form organicznych, dzięki czemu najlepiej pasuje do szybkiego prototypowania prostych obiektów.

poruszającego się od tłumowanego pola 3D AI generatorów AI aktywny i konkurencyjny rynek generowania treści 3D . Kilka innych głównych firm technologicznych opracowało własne rozwiązania, każde z unikalnym podejściem do rozwiązania tego złożonego wyzwania.

Meta agresywnie dąży do tej przestrzeni, aby wypełnić swoją platformę Horizon Worlds. Jego najnowszy model, AssetGen 2.0, generuje wysokiej jakości zasoby 3D zarówno z podpowiedzi tekstowych, jak i obrazu, co stanowi znaczący skok w stosunku do swojego poprzednika. Meta przedstawiciel, Joel Hesch, podzielił się podekscytowaniem postępami, stwierdzając: „Dzielenie się podstępnym szczytem Assetgen V2. Robiąc ogromne postępy w umożliwieniu każdemu modelu 3D, który można sobie wyobrazić.„

Meta koncentruje się na wysokiej zawartości bielizny, realizujemy grę, wykorzystywanie nowej architektury dyfuzji 3D, aby osiągnąć konsystencję geometryczną i drobną szczegółową koncentrację. Kontrastuje to z bardziej eksperymentalnym, „wystarczającym” wyjściem z bieżącej iteracji Copilot 3D.

Tymczasem gigant gier Roblox wykonał trasę open source z modelem 3D CUBE. Ten system jest wyjątkowo tokenizuje kształty 3D do konstruowania obiektów z podpowiedzi tekstowych, metody podobnej do sposobu przetwarzania słów modeli językowych. Oprócz narzędzia, Roblox ma na celu wspieranie szerokiej społeczności deweloperów.

Firma ma ambitne plany ewolucji. Roblox stwierdził: „Ostatecznie będzie to model multimodalny, wyszkolony w zakresie tekstu, obrazów, wideo i innych rodzajów danych wejściowych.”, Sygnalizując przejście do bardziej wszechstronnego, multimodalnego systemu, który oprócz tekstu może przetwarzać obrazy i wideo. Ta strategia skoncentrowana na społeczności różni się gwałtownie od podejścia zintegrowanego na platformie Microsoft.

AI stabilności była również kluczowym innowatorem, koncentrującym się na szybkości i wydajności. Jego stabilny szybki model 3D może wytworzyć zasób 3D z jednego obrazu w poniżej drugiego, co stanowi dramatyczną poprawę w stosunku do wcześniejszych technologii. Ta bogata historia innowacji w terenie sięga narzędzi takich jak Shap · e, wydana w maju 2023 r.

Szersze poszukiwanie dostępnych treści 3D

Podstawową strategią dla wszystkich tych firm jest demokratyzacja tworzenia treści 3D. Od dziesięcioleci budowanie modeli 3D jest pracochłonnym procesem wymagającym specjalistycznych umiejętności i drogiego, złożonego oprogramowania. AI obiecuje zmienić to, potencjalnie rewolucjonizując branże od gier i filmu po architekturę i e-commerce.

, osadzając bezpłatne, łatwe w użyciu narzędzie bezpośrednio do Copilot, Microsoft wykonuje wyraźną grę w celu masowego adopcji, mając nadzieję, że generacja 3D stał się okaźnym, codziennym zadaniem. Podejście to kontrastuje ze strategią Meta Garden-Garden dla Horizon Worlds i opartymi na społeczności wysiłków Open Surce Roblox.

Każda firma obstawia, że jej platforma stanie się punktem wyjścia dla następnej generacji twórców. Jednak ostateczny wpływ narzędzi takich jak Copilot 3D będzie zależeć całkowicie od ich rzeczywistej wydajności i niezawodności. Podczas gdy technologia szybko się rozwija, zabawnie wadliwe wyniki z wczesnych testów pokazują, że wciąż jest długa droga.

Categories: IT Info