Η Microsoft ξεκίνησε το Copilot 3D, ένα νέο πειραματικό χαρακτηριστικό που δημιουργεί μοντέλα 3D απευθείας από 2D εικόνες. Κυκλοφόρησε στις 8 Αυγούστου 2025, το εργαλείο είναι διαθέσιμο δωρεάν σε όλους τους υπογεγραμμένους χρήστες μέσω copilot labs στον ιστό Η ευρύτερη ενσωμάτωση της Microsoft για το νέο μοντέλο GPT-5 της OpenAI σε όλες τις υπηρεσίες του, ενσωματώνοντας το ισχυρό AI στη βασική σουίτα προϊόντων. Η εκτόξευση σηματοδοτεί μια σαφή πρόθεση να μειωθεί το εμπόδιο για τους σχεδιαστές, τους χομπίστες και τους προγραμματιστές, αν και οι αρχικές πρακτικές δοκιμές αποκαλύπτουν ότι η τεχνολογία εξακολουθεί να βρίσκεται σε πρώιμα, πειραματικά στάδια προς την απλοποίηση των πολύπλοκων Workflows. Το εργαλείο κατοικεί στα εργαστήρια Copilot, το καθορισμένο έδαφος δοκιμών της εταιρείας για χαρακτηριστικά AI πρώιμου σταδίου. Αυτή η τοποθέτηση υποδηλώνει ότι το εργαλείο δεν έχει ακόμη θεωρηθεί ένα γυαλισμένο, έτοιμο παραγωγής χαρακτηριστικό, αλλά μάλλον μια δημόσια προεπισκόπηση των μελλοντικών δυνατοτήτων. Src=”Δεδομένα: Εικόνα/SVG+XML; Nitro-Empty-Id=MtyznzoyMzu=-1, Base64, Phn2zyb2awv3qm94psiwidagotywidu0 Mcigd2lkdgg9ijk2mcigagvpz2h0psi1ndaiihhtbg5zpsjodhrwoi8vd3d3lnczlm9yzy8ymdawl3n2zyi+pc9zdmc+”>
Η διαδικασία είναι απλή: Οι χρήστες ανεβάζουν ένα αρχείο PNG ή JPG και το AI προσπαθεί να κατασκευάσει ένα τρισδιάστατο αντικείμενο από αυτό. Το εργαλείο υποστηρίζει αυτήν τη στιγμή μόνο αυτόν τον αγωγό εικόνας προς 3D και δεν παράγει μοντέλα από τις προτροπές κειμένου. Ο στόχος της εταιρείας είναι να καταργήσει τα παραδοσιακά εμπόδια στην είσοδο. Στην επίσημη ανακοίνωσή της, η Microsoft δήλωσε ότι”το Copilot 3D καθιστά την 3D δημιουργία πιο προσιτή. Με μία μόνο εικόνα που μπορεί κανείς να αρχίσει να διαμορφώνει ιδέες σε τρεις διαστάσεις, χωρίς να υπάρχει καμπύλη εκμάθησης. Hands-on σχόλια από καταστήματα όπως Το verge Το Copilot 3D φαίνεται να χειρίζεται καλά καθορισμένα, άψυχα αντικείμενα με σαφή φωτισμό και φόντο με σχετική επιτυχία. Οι δοκιμαστές ανέφεραν αξιοπρεπή αποτελέσματα κατά τη μετατροπή των εικόνων των επίπλων IKEA.
Το AI αγωνίζεται σημαντικά, ωστόσο, όταν αντιμετωπίζει πιο πολύπλοκα, οργανικά άτομα. Τα ζώα και οι άνθρωποι έχουν αποδειχθεί ιδιαίτερα δύσκολο, συχνά οδηγώντας σε παραμορφωμένα και παράξενα μοντέλα. Αυτός ο περιορισμός καταγράφηκε έντονα σε μια ευρέως κοινή δοκιμασία που περιλαμβάνει ένα κατοικίδιο σκύλο. Εδώ, αλλά φαίνεται ότι ο Copilot προσπάθησε να μαντέψει ότι το σκυλί μου έχει ένα πέος (το κάνει), και στη συνέχεια αποφάσισε να βάλει αυτό το πέος στην πλάτη του.”Αυτή η κωμική αποτυχία υπογραμμίζει την εκκολαπτόμενη κατάσταση της τεχνολογίας.
Ενώ το AI μπορεί να ερμηνεύσει τα βασικά σχήματα από μια εικόνα 2D, στερείται του λεπτού πεδίου της ανατομικής κατανόησης που απαιτείται για τις ζωντανές οργανικές μορφές, καθιστώντας το καλύτερο για ταχεία πρωτότυπα των απλών αντικειμένων. Το Copilot 3D το τοποθετεί σε όλο και περισσότερο ενεργή και ανταγωνιστική αγορά για τη δημιουργία περιεχομένου AI-Driven 3D . Αρκετές άλλες μεγάλες εταιρείες τεχνολογίας έχουν αναπτύξει τις δικές τους λύσεις, καθένα με μια μοναδική προσέγγιση για την αντιμετώπιση αυτής της περίπλοκης πρόκλησης.
Meta έχει επιδιώξει επιθετικά αυτόν τον χώρο για να συμπληρώσει την πλατφόρμα του Horizon Worlds. Το τελευταίο μοντέλο του, το AssetGen 2.0, δημιουργεί υψηλής ποιότητας τρισδιάστατα περιουσιακά στοιχεία από τις προτροπές κειμένου και εικόνας, ένα σημαντικό άλμα έναντι του προκάτοχού του. Ένας εκπρόσωπος μεταδιδακτορικού, Joel Hesch, μοιράστηκε τον ενθουσιασμό του για την πρόοδο, δηλώνοντας:”Η κοινή χρήση μιας κορυφής του Assetgen V2 σήμερα, σημειώνουμε μια τεράστια πρόοδο στο να δημιουργήσουμε οποιονδήποτε τύπο μοντέλου 3D που μπορεί να φανταστεί.”Αυτό έρχεται σε αντίθεση με την πιο πειραματική,”καλή”έξοδο από την τρέχουσα επανάληψη του Copilot 3D. Εν τω μεταξύ, ο γίγαντας του παιχνιδιού Roblox έχει πάρει μια διαδρομή ανοιχτού κώδικα με το μοντέλο Cube 3D. Αυτό το σύστημα διακόπτει με μοναδικό τρόπο τα σχήματα 3D για την κατασκευή αντικειμένων από τις προτροπές κειμένου, μια μέθοδο παρόμοια με τον τρόπο με τον οποίο τα μοντέλα γλωσσών επεξεργάζονται λέξεις. Με την ανοικτή προσφορά του εργαλείου, η Roblox στοχεύει στην προώθηση μιας ευρείας κοινότητας προγραμματιστών.
Η εταιρεία έχει φιλόδοξα σχέδια για την εξέλιξή της. Ο Roblox δήλωσε:”Θα είναι τελικά ένα πολυτροπικό μοντέλο, εκπαιδευμένο σε κείμενο, εικόνες, βίντεο και άλλους τύπους εισροών.”, Σηματοδοτώντας μια κίνηση προς ένα πιο ευπροσάρμοστο, πολυτροπικό σύστημα που μπορεί να επεξεργαστεί εικόνες και βίντεο εκτός από το κείμενο. Αυτή η στρατηγική που επικεντρώνεται στην κοινότητα διαφέρει απότομα από την ενσωματωμένη προσέγγιση της Microsoft. Το σταθερό γρήγορο μοντέλο 3D του μπορεί να παράγει ένα 3D περιουσιακό στοιχείο από μία μόνο εικόνα κάτω από ένα δευτερόλεπτο, μια δραματική βελτίωση σε σχέση με τις προηγούμενες τεχνολογίες. Αυτή η πλούσια ιστορία της καινοτομίας στον τομέα χρονολογείται από εργαλεία όπως το Shap · E του OpenAi, που κυκλοφόρησε τον Μάιο του 2023. Για δεκαετίες, η οικοδόμηση μοντέλων 3D ήταν μια διαδικασία έντασης εργασίας που απαιτεί εξειδικευμένες δεξιότητες και ακριβό, πολύπλοκο λογισμικό. Η AI υπόσχεται να αλλάξει αυτό, ενδεχομένως να επαναφέρει τις βιομηχανίες από τα τυχερά παιχνίδια και την ταινία στην αρχιτεκτονική και το ηλεκτρονικό εμπόριο. Αυτή η προσέγγιση έρχεται σε αντίθεση με τη στρατηγική του Meta για το Walled-Garden για τους Horizon Worlds και τις προσπάθειες ανοιχτού κώδικα της Roblox. Κάθε εταιρεία στοιχηματίζει ότι η πλατφόρμα της θα γίνει το σημείο εκκίνησης για την επόμενη γενιά δημιουργών. Ωστόσο, ο τελικός αντίκτυπος των εργαλείων όπως το Copilot 3D θα εξαρτηθεί εξ ολοκλήρου από την πραγματική απόδοση και την αξιοπιστία τους. Ενώ η τεχνολογία προχωράει γρήγορα, τα διασκεδαστικά ελαττωματικά αποτελέσματα από τις πρώτες δοκιμές δείχνουν ότι υπάρχει ακόμα πολύς δρόμος.