Microsoft har lanserat Copilot 3D, en ny experimentell funktion som genererar 3D-modeller direkt från 2D-bilder. Släppt den 8 augusti 2025, är verktyget gratis för alla inskrivna användare via copilot labs på webben , sikte att göra 3D-innehåll som enkelt som enkelt som uppladdning en bild. Microsofts bredare integration av OpenAI: s nya GPT-5-modell över sina tjänster och inbäddar kraftfull AI i sin kärnproduktsvit. Lanseringen signalerar en tydlig avsikt att sänka barriären för designers, hobbyister och utvecklare, även om initiala praktiska tester avslöjar att tekniken fortfarande är i sina tidiga, experimentella stadier.

Ett nytt verktyg för att demokratisera 3D-skapande

Microsoft är positionering av copilot 3D som ett stort styv mot enkla creative creative. Verktyget finns i Copilot Labs, företagets utsedda testplats för AI-funktioner i tidigt skede. Denna placering föreslår att verktyget ännu inte anses vara en polerad, produktionsklar funktion utan snarare en offentlig förhandsgranskning av framtida kapacitet.

>

Processen är enkel: användare laddar upp en PNG-eller JPG-fil, och AI försöker konstruera ett tredimensionellt objekt från det. Verktyget stöder för närvarande bara denna bild-till-3D-rörledning och genererar inte modeller från textuppmaningar.

resulterande modeller kan laddas ner i GLB-formatet, en mångsidig standard kompatibel med många 3D-tittare, spelmotorer och designapplikationer. Företagets mål är att ta bort traditionella inträdeshinder. I sitt officiella tillkännagivande uttalade Microsoft,”Copilot 3D gör 3D-skapelsen mer tillgänglig. Med bara en enda bild kan vem som helst börja forma idéer till tre dimensioner. Ingen brant inlärningskurva. Ingen skrämmande programvara.”, Under-understörning av dess vision om tillgängliga skapande för alla. Tidiga praktiska recensioner från butiker som The Verge Visa verktygets prestanda är för närvarande en blandad påse. Copilot 3D verkar hantera väl definierade, livlösa föremål med tydlig belysning och bakgrunder med relativ framgång. Testare rapporterade anständiga resultat när de konverterade bilder av IKEA-möbler.

AI-kämpar emellertid betydligt när de möter mer komplexa, organiska ämnen. Djur och människor har visat sig vara särskilt utmanande, vilket ofta resulterat i förvrängda och bisarra modeller. Denna begränsning fångades levande i ett allmänt delat test som involverade en husdjur.

som Tom Warren från Verge humoristiskt

While the AI can interpret basic shapes from a 2D image, it lacks the nuanced anatomical understanding needed for lifelike organic forms, making it best suited for rapid prototyping of simple objects.

Navigating a Crowded Field of 3D AI Generators

Microsoft’s entry Med Copilot 3D placerar det i en alltmer Aktiv och konkurrensmarknad för AI-driven 3D-innehåll . Flera andra stora teknikföretag har utvecklat sina egna lösningar, var och en med en unik strategi för att hantera denna komplexa utmaning.

meta har aggressivt bedrivit detta utrymme för att fylla sin Horizon Worlds-plattform. Den senaste modellen, AssetGen 2.0, genererar 3D-tillgångar av hög kvalitet från både text och bilduppmaningar, ett betydande språng över sin föregångare. En metarepresentant, Joel Hesch, delade sin spänning för framstegen och uppgav,”Dela en sneak peak of Assetgen V2 idag. Vi har gjort enorma framsteg på att göra det möjligt för alla typer av 3D-modell de kan föreställa sig.”

metas fokus är på högfilmitet, spel-redo att använda, anställa en nystad 3D-arkitektur. Detta står i kontrast till den mer experimentella,”tillräckligt bra”produktionen från Copilot 3D: s nuvarande iteration.

Under tiden har speljätten Roblox tagit en öppen källkod med sin Cube 3D-modell. Detta system tokeniserar på ett unikt 3D-former för att konstruera objekt från textmeddelanden, en metod som liknar hur språkmodeller bearbetar ord. Genom att öppna verktyget syftar Roblox till att främja ett brett utvecklargemenskap.

Företaget har ambitiösa planer för sin utveckling. Roblox har sagt,”Det kommer i slutändan att vara en multimodal modell, utbildad på text, bilder, video och andra typer av input.”, Signalerar ett steg mot ett mer mångsidigt, multimodalt system som kan bearbeta bilder och video utöver text. Denna samhällsfokuserade strategi skiljer sig kraftigt från Microsofts plattformsintegrerade strategi.

Stabilitet AI har också varit en viktig innovatör, med fokus på hastighet och effektivitet. Dess stabila snabba 3D-modell kan producera en 3D-tillgång från en enda bild på under en sekund, en dramatisk förbättring jämfört med tidigare tekniker. Denna rika innovationshistoria inom fältet går tillbaka till verktyg som Openais Shap · E, släppt i maj 2023.

Den bredare strävan efter tillgängligt 3D-innehåll

Den underliggande strategin för alla dessa företag är demokratiseringen av 3D-innehållsskapande. I decennier har byggnad 3D-modeller varit en arbetsintensiv process som kräver specialiserade färdigheter och dyr, komplex mjukvara. AI lovar att förändra det, potentiellt revolutionerande branscher från spel och film till arkitektur och e-handel.

Genom att bädda in ett gratis, lättanvänt verktyg direkt i copilot gör Microsoft ett tydligt spel för massanpassning, i hopp om att göra 3D-generationen till en avslappnad, vardaglig uppgift. Detta tillvägagångssätt står i kontrast till Metas Walled-Garden-strategi för Horizon Worlds och Robloxs samhällsdrivna öppna källkodsinsatser.

Varje företag satsar på att dess plattform kommer att bli utgångspunkten för nästa generation av skapare. Emellertid kommer den ultimata effekten av verktyg som Copilot 3D att bero helt på deras verkliga prestanda och tillförlitlighet. Medan tekniken utvecklas snabbt, visar de underhållande felaktiga resultaten från tidiga tester att det fortfarande finns en lång väg att gå.

Categories: IT Info