Microsoft ha lanciato Copilot 3D, una nuova funzione sperimentale che genera modelli 3D direttamente da immagini 2D. Rilasciato l’8 agosto 2025, lo strumento è disponibile gratuitamente per tutti gli utenti firmati tramite laborato La più ampia integrazione di Microsoft del nuovo modello GPT-5 di Openi attraverso i suoi servizi, incorporando una potente intelligenza artificiale nella sua suite di prodotti principali. Il lancio segnala una chiara intenzione di abbassare la barriera per designer, hobbisti e sviluppatori, sebbene i test pratici iniziali rivelano che la tecnologia è ancora nelle sue fasi iniziali e sperimentali.

Un nuovo strumento per democratizzare la creazione 3D

MicroSoft sta posizionando Copilot 3D come semplificare il complesso lavoro creativo. Lo strumento risiede nei Copilot Labs, il terreno di test designato dell’azienda per le funzionalità di intelligenza artificiale in fase iniziale. Questo posizionamento suggerisce che lo strumento non è ancora considerato una caratteristica raffinata e pronta per la produzione, ma piuttosto un’anteprima pubblica delle capacità future.

>

Il processo è semplice: gli utenti caricano un file PNG o JPG e l’IA tenta di costruire un oggetto tridimensionale da esso. Lo strumento attualmente supporta solo questa pipeline da immagine a 3D e non genera modelli da istruzioni di testo.

I modelli risultanti possono essere scaricati in formato GLB, un versatile standard compatibile con molti spettatori 3D, motori di gioco e applicazioni di design. L’obiettivo dell’azienda è rimuovere gli ostacoli tradizionali all’ingresso. Nel suo annuncio ufficiale, Microsoft ha dichiarato:”Il copilota 3D rende la creazione 3D più accessibile. Con una sola immagine chiunque può iniziare a modellare le idee in tre dimensioni. Nessuna ripida curva di apprendimento. Nessun software intimidatorio.”, Sottolineando la sua visione della creazione accessibile per tutti.

I primi test rivelano promesse e pace di palette. Recensioni pratiche da punti vendita come Il verge mostra che le prestazioni dello strumento sono attualmente una borsa mescolata. Il copilota 3D sembra gestire oggetti inanimati ben definiti con illuminazione chiara e sfondi con un relativo successo. I tester hanno riportato risultati decenti durante la conversione di immagini di mobili IKEA.

L’IA lotta significativamente, tuttavia, di fronte a soggetti più complessi e organici. Animali e umani si sono dimostrati particolarmente impegnativi, spesso con conseguenti modelli distorti e bizzarri. Questa limitazione è stata vividamente catturata in un test ampiamente condiviso che coinvolge un cane da compagnia.

Come tom Warren del Verge in modo umoristico

Mentre l’IA può interpretare le forme di base da un’immagine 2D, manca la comprensione anatomica sfumata necessaria per le forme organiche realistiche, rendendolo più adatto a una prototipizzazione rapida mercato attivo e competitivo per la generazione di contenuti 3D guidata dall’Ai-guidato . Diverse altre grandi aziende tecnologiche hanno sviluppato le proprie soluzioni, ognuna con un approccio unico per affrontare questa complessa sfida.

Meta ha perseguito in modo aggressivo questo spazio per popolare la sua piattaforma di Orizzonte Worlds. Il suo ultimo modello, AssetGen 2.0, genera risorse 3D di alta qualità da istruzioni di testo e immagini, un salto significativo sul suo predecessore. Un meta-rappresentante, Joel Hesch, ha condiviso la sua eccitazione per i progressi, affermando:”Condividendo un picco di Assetgen V2 oggi. Abbiamo fatto enormi progressi sul fatto che abilitare chiunque di creare qualsiasi tipo di modello 3D che possono immaginare.”

Focus di META e FOTTA DISPASSAGGIO. Ciò contrasta con l’output più sperimentale,”abbastanza buono”dall’attuale iterazione di Copilot 3D.

Nel frattempo, il gigante di gioco Roblox ha preso un percorso open source con il suo modello 3D cubo. Questo sistema tokenizza in modo univoco le forme 3D per costruire oggetti da istruzioni di testo, un metodo simile al modo in cui i modelli linguistici elaborano le parole. Open-sourcing lo strumento, Roblox mira a favorire una vasta comunità di sviluppatori.

La società ha piani ambiziosi per la sua evoluzione. Roblox ha dichiarato:”Alla fine sarà un modello multimodale, addestrato su testo, immagini, video e altri tipi di input”, segnala una mossa verso un sistema più versatile e multimodale che può elaborare immagini e video oltre al testo. Questa strategia incentrata sulla comunità differisce bruscamente dall’approccio integrato dalla piattaforma di Microsoft.

La stabilità AI è stata anche un innovatore chiave, concentrandosi su velocità e efficienza. Il suo modello 3D veloce stabile può produrre una risorsa 3D da una singola immagine in meno di un secondo, un drammatico miglioramento rispetto alle tecnologie precedenti. Questa ricca storia di innovazione sul campo risale a strumenti come la forma di Openi, rilasciata nel maggio 2023.

La più ampia ricerca di contenuti 3D accessibili

La strategia sottostante per tutte queste aziende è la democratizzazione della creazione di contenuti 3D. Per decenni, la costruzione di modelli 3D è stato un processo ad alta intensità di lavoro che richiede competenze specializzate e software costoso e complesso. L’intelligenza artificiale promette di cambiarlo, potenzialmente rivoluzionando le industrie da giochi e film all’architettura e al commercio elettronico.

Incorporando uno strumento gratuito e facile da usare direttamente nel copilota, Microsoft sta facendo un gioco chiaro per l’adozione di massa, sperando di rendere la generazione 3D un compito casuale e quotidiano. Questo approccio contrasta con la strategia di Garden murata di Meta per gli sforzi open source di Horizon Worlds e Roblox. Tuttavia, il massimo impatto di strumenti come Copilot 3D dipenderà interamente dalle loro prestazioni e affidabilità del mondo reale. Mentre la tecnologia sta avanzando rapidamente, i risultati divertenti dai primi test mostrano ancora molta strada da fare.

Categories: IT Info