Το Google DeepMind ξεκίνησε μια νέα πρωτοβουλία για τη δημιουργία προηγμένων συστημάτων τεχνητής νοημοσύνης (AI) ικανά να προσομοιώνουν φυσικά και εικονικά περιβάλλοντα.
Ο Tim Brooks, πρώην ερευνητής στο OpenAI, ηγείται τώρα της προσπάθειας, η οποία επικεντρώνεται σχετικά με τα «μοντέλα του κόσμου»—Συστήματα τεχνητής νοημοσύνης σχεδιασμένα να προβλέπουν και να αλληλεπιδρούν με τη δυναμική του πραγματικού κόσμου. Σε μια δημοσίευση στο X, ο Μπρουκς δήλωσε: «Η DeepMind έχει φιλόδοξα σχέδια να κάνει τεράστια μοντέλα παραγωγής που προσομοιώνουν τον κόσμο.”
Αυτό το έργο είναι στενά συνδεδεμένο με τη μεγαλύτερη στρατηγική της Google για την προώθηση της τεχνητής γενικής νοημοσύνης (AGI). Τα παγκόσμια μοντέλα θεωρούνται ως ένα θεμελιώδες βήμα για την επίτευξη του AGI, μιας μορφής τεχνητής νοημοσύνης ικανής να εκτελέσει οποιοδήποτε πνευματικό έργο που μπορεί ένας άνθρωπος.
Η νέα ομάδα θα συνεργαστεί με υπάρχοντα έργα DeepMind, συμπεριλαμβανομένου του AI Gemini multimodal μοντέλο, η πλατφόρμα παραγωγής βίντεο Veo και η Genie, μια γεννήτρια περιβάλλοντος για διαδραστικές τρισδιάστατες προσομοιώσεις.
Η DeepMind έχει φιλόδοξα σχέδια να κατασκευάσει τεράστια μοντέλα παραγωγής που προσομοιώνουν τον κόσμο. Προσλαμβάνω σε μια νέα ομάδα με αυτή την αποστολή. Ελάτε να δημιουργήσετε μαζί μας!https://t.co/pqvALtAvLs https://t.co/vtwgeXl9Dl
— Tim Brooks (@_tim_brooks) 6 Ιανουαρίου 2025
Παγκόσμιο μοντέλο AIing
Τα παγκόσμια μοντέλα αντιπροσωπεύουν σημαντική απόκλιση από τα παραδοσιακά συστήματα AI, τα οποία αντιδρούν κυρίως στις εισαγωγές δεδομένων. Αντίθετα, αυτά τα μοντέλα προσομοιώνουν πολύπλοκα περιβάλλοντα αναλύοντας πολυτροπικά δεδομένα, όπως κείμενο, εικόνες και βίντεο. Αυτή η δυνατότητα πρόβλεψης επιτρέπει εφαρμογές σε διάφορους τομείς, από εκπαίδευση ρομποτικής έως διαδραστικά παιχνίδια.
α> για τη νέα ομάδα τονίζει τους ευρύτερους στόχους: «Πιστεύουμε ότι η κλιμάκωση της προεκπαίδευσης σε δεδομένα βίντεο και πολυτροπικών δεδομένων βρίσκεται στην κρίσιμη διαδρομή προς την τεχνητή γενική νοημοσύνη. Τα παγκόσμια μοντέλα θα τροφοδοτήσουν πολλούς τομείς, όπως ο οπτικός συλλογισμός και η προσομοίωση, ο σχεδιασμός για ενσωματωμένους πράκτορες και η διαδραστική ψυχαγωγία σε πραγματικό χρόνο.”
Με την προσομοίωση της δυναμικής του πραγματικού κόσμου, τα παγκόσμια μοντέλα παρέχουν ένα εικονικό sandbox για δοκιμές και μάθηση, ενισχύοντας την ικανότητα της τεχνητής νοημοσύνης να προσαρμόζεται και να ανταποκρίνεται σε σενάρια πραγματικού κόσμου.
Το έργο Genie του DeepMind προσφέρει Δείτε τις δυνατότητες Το Genie 2, το οποίο κυκλοφόρησε τον Δεκέμβριο, μπορεί να δημιουργήσει τρισδιάστατους κόσμους με δυνατότητα αναπαραγωγής βάσει των προτροπών των χρηστών.=”732″ύψος=”412″src=”https://winbuzzer.com/wp-content/uploads/2025/01/image.png”>Διαδραστική επίδειξη προσομοίωσης AI καρέ-καρέ που δημιουργήθηκε με το Google Genie 2 (Πηγή: Google)
Το έργο σχετικά με τα παγκόσμια μοντέλα είναι εγγενώς πολύπλοκο, απαιτώντας υποδομή αιχμής και τεράστιους υπολογιστικούς πόρους της DeepMind για έναν ρόλο Ερευνητή στην παγκόσμια μοντελοποίηση σκιαγραφεί τις τεχνικές προκλήσεις που εμπλέκονται. Οι αρμοδιότητες περιλαμβάνουν:
Εκπαίδευση πολυτροπικών μετασχηματιστών μεγάλης κλίμακας ικανών να αναλύουν διαφορετικούς τύπους δεδομένων. Δημιουργία υποδομής για αγωγούς δεδομένων βίντεο, διασφαλίζοντας αποτελεσματική επιμέλεια και σχολιασμό. Βελτιστοποίηση συστημάτων συμπερασμάτων για εφαρμογές σε πραγματικό χρόνο, επιτρέποντας την απρόσκοπτη διαδραστικότητα. Ανάπτυξη μετρήσεων ποσοτικής αξιολόγησης για τη μέτρηση της φυσικής ακρίβειας και ευφυΐας. Εξερεύνηση μετασχηματιστών εξαιρετικά μεγάλου περιβάλλοντος, οι οποίοι επιτρέπουν στην τεχνητή νοημοσύνη να αναλύει εκτεταμένες ακολουθίες δεδομένων.
Η έμφαση στην κλιμάκωση αντικατοπτρίζει τη δέσμευση να γίνουν αυτά τα συστήματα τόσο ισχυρά όσο και αποτελεσματικά. Η φιλοσοφία του DeepMind, που συνοψίζεται ως οι βασικές ευθύνες στην περιγραφή της θέσης εργασίας, υπογραμμίζει αυτήν την προσέγγιση:
«Εφαρμογή βασικής υποδομής και διεξαγωγή έρευνας για τη δημιουργία μοντέλων παραγωγής του φυσικού κόσμου. Λύστε βασικά προβλήματα για να εκπαιδεύσετε προσομοιωτές κόσμου σε τεράστια κλίμακα, αναπτύξτε μετρήσεις και νόμους κλιμάκωσης για τη φυσική νοημοσύνη, επιμελήστε και σχολιάστε δεδομένα εκπαίδευσης, ενεργοποιήστε τη διαδραστική παραγωγή σε πραγματικό χρόνο και μελετήστε την ενοποίηση παγκόσμιων μοντέλων με μοντέλα πολυτροπικών γλωσσών. Αγκαλιάστε το πικρό μάθημα και αναζητήστε απλές μεθόδους που κλιμακώνονται, με έμφαση σε ισχυρά συστήματα και υποδομές.”
Εφαρμογές και συνέπειες
Τα παγκόσμια μοντέλα έχουν διαφορετικές εφαρμογές σε Στη ρομποτική, επιτρέπουν τη δημιουργία εικονικών περιβαλλόντων όπου οι μηχανές μπορούν να μάθουν να πλοηγούνται και να χειρίζονται αντικείμενα
Η Genesis, μια πλατφόρμα προσομοίωσης φυσικής ανοιχτού κώδικα που αναπτύχθηκε από το Πανεπιστήμιο Carnegie Mellon και ιδιωτικούς ερευνητές της βιομηχανίας, δείχνει πώς τα συστήματα AI μπορούν να εκπαιδευτούν για τρισδιάστατη φυσική σε ένα εντελώς εικονικό περιβάλλον πολύ πιο γρήγορα από ό,τι στον πραγματικό κόσμο.
Στα παιχνίδια, τα παγκόσμια μοντέλα δημιουργούν καθηλωτικές εμπειρίες με δυναμικά περιβάλλοντα με απόκριση Η τεχνολογία έχει επίσης δυνατότητες στον τομέα της υγείας, όπου οι προσομοιώσεις θα μπορούσαν να βοηθήσουν στη διάγνωση και εξατομικευμένος σχεδιασμός θεραπείας.
Παρά την υπόσχεσή τους, αυτές οι εξελίξεις συνοδεύονται από προκλήσεις σχετικά με ηθικές ανησυχίες, ιδίως όσον αφορά τον εκτοπισμό των εργαζομένων. Το Animation Guild υπολογίζει ότι πάνω από 100.000 θέσεις εργασίας στις ΗΠΑ στον κινηματογράφο, την τηλεόραση και τα κινούμενα σχέδια θα μπορούσαν να επηρεαστούν από τις τεχνολογίες AI έως το 2026.
Επίσης, προκύπτουν νομικά ζητήματα, καθώς ορισμένα παγκόσμια μοντέλα βασίζονται σε πλάνα βιντεοπαιχνιδιών χωρίς άδεια για εκπαίδευση. Ενώ η Google ισχυρίζεται ότι οι πρακτικές της συμμορφώνονται με τους όρους παροχής υπηρεσιών του YouTube, δεν έχει αποκαλύψει συγκεκριμένες πηγές δεδομένων.
Ανταγωνισμός στο χώρο της τεχνητής νοημοσύνης
Θέσεις πρωτοβουλίας της DeepMind της DeepMind. Η Google σε έναν ανταγωνιστικό αγώνα με άλλους σημαντικούς παίκτες. Η νέα πλατφόρμα Cosmos της Nvidia εστιάζει στη φυσική τεχνητή νοημοσύνη και τη ρομποτική, ενώ το Τα εργαστήρια World Labs της Fei-Fei Li αναπτύσσουν παγκόσμια μοντέλα μεγάλης κλίμακας με χωρική νοημοσύνη για ποικίλες εφαρμογές. Startups όπως η Odyssey και η Decart επίσης κάνουν κάνει βήματα, συμβάλλοντας στο αναπτυσσόμενο πεδίο των προσομοιώσεων κόσμου της τεχνητής νοημοσύνης.
Η πρόσβαση της DeepMind στα Gemini AI, Veo και Genie προσφέρει ένα μοναδικό πλεονέκτημα. Με την ενσωμάτωση αυτών των συστημάτων, η ομάδα στοχεύει στη δημιουργία τεχνητής νοημοσύνης που όχι μόνο προβλέπει τα αποτελέσματα αλλά και προσαρμόζεται σε μεταβαλλόμενα σενάρια σε πραγματικό χρόνο. Αυτή η ικανότητα μπορεί να είναι κρίσιμη για την επίτευξη του AGI, όπου η προσαρμοστικότητα και η γενίκευση είναι βασικές.
DeepMind’s Vision for AGI
Ενώ η τεχνητή γενική νοημοσύνη παραμένει μακρινή αλλά εφικτή. Στόχος, τα παγκόσμια μοντέλα είναι ένα κρίσιμο βήμα σε αυτό το μονοπάτι. Με την προσομοίωση φυσικών και εικονικών περιβαλλόντων, αυτά τα μοντέλα παρέχουν τη βάση για συστήματα τεχνητής νοημοσύνης που μπορούν να συλλογιστούν, να σχεδιάσουν και να αλληλεπιδράσουν όπως οι άνθρωποι.
Η περιγραφή της θέσης εργασίας του Ερευνητή Μηχανικού αποτυπώνει την ουσία του οράματος του DeepMind: «Τα παγκόσμια μοντέλα θα ισχύουν για την ισχύ. πολυάριθμοι τομείς, όπως ο οπτικός συλλογισμός και η προσομοίωση, ο σχεδιασμός για ενσωματωμένους πράκτορες και η διαδραστική ψυχαγωγία σε πραγματικό χρόνο.”