Η NVIDIA ανακοίνωσε αρκετές εξελίξεις στην τεχνητή νοημοσύνη στην CES 2025, αποκαλύπτοντας νέες εξελίξεις που συγχωνεύουν τις προηγούμενες επιτυχίες της εταιρείας στη δημιουργία συνθετικών δεδομένων με την εστίασή της στην αυτόνομη λήψη αποφάσεων.

Οι νέες εκδόσεις περιλαμβάνουν το Πλατφόρμα Cosmos World Foundation Model (WFM)—ένα εκτενές εργαλειοθήκη για τη δημιουργία φωτορεαλιστικών βίντεο και σεναρίων με βάση τη φυσική—και το Llama Nemotron συν Οικογένειες Cosmos Nemotron, οι οποίες επιτρέπουν τη γλώσσα, το όραμα και τη λήψη αποφάσεων AI σε διάφορους τομείς όπως η ρομποτική, η υγειονομική περίθαλψη, και αυτόνομα οχήματα.

Σχετικά: Η Nvidia αποκαλύπτει RTX 50-Series Blackwell GPU με GPU με DLSS 4 και διπλάσια δύναμη του RTX 4090

Εμείς δημιουργήσαμε εκδημοκρατίστε τη φυσική τεχνητή νοημοσύνη και βάλτε τη γενική ρομποτική σε όλους προγραμματιστής», δήλωσε ο Jensen Huang, ιδρυτής και διευθύνων σύμβουλος της NVIDIA.”Οι πράκτορες AI είναι η επόμενη ρομποτική βιομηχανία και πιθανότατα θα είναι μια ευκαιρία πολλών δισεκατομμυρίων δολαρίων.”

Συνδυάζοντας τη δημιουργία συνθετικών δεδομένων, την επεξεργασία όρασης και τα προηγμένα μοντέλα γλώσσας κάτω από μια ομπρέλα, η NVIDIA φιλοδοξεί να εξορθολογίσει τη μετάβαση από δημιουργία δεδομένων σε πλήρως λειτουργικά συστήματα τεχνητής νοημοσύνης Αυτή η προσέγγιση ακολουθεί την επιτυχία της σειράς Nemotron-4 340B, η οποία αντιμετώπιζε προηγουμένως ελλείψεις. δεδομένα εκπαίδευσης υψηλής ποιότητας για μεγάλα γλωσσικά μοντέλα (LLM).

[ενσωματωμένο περιεχόμενο]

Nemotron-4 340B: Establishing a Data-Driven Foundation

Στο Στα μέσα του 2024, η NVIDIA παρουσίασε τα μοντέλα Nemotron-4 340B για την αντιμετώπιση της περιορισμένης διαθεσιμότητας δεδομένων για πολύπλοκες εφαρμογές τεχνητής νοημοσύνης συνθετικά δεδομένα σε κλίμακα, επιτρέποντας τη βελτίωση και την προσαρμογή υψηλού επιπέδου για βιομηχανίες όπως η υγειονομική περίθαλψη, η χρηματοδότηση και η κατασκευή.

Το Nemotron-4 340B προσέφερε τρεις παραλλαγές—Τα μοντέλα The Instruct βοήθησαν τους προγραμματιστές να καθοδηγήσουν Η τεχνητή νοημοσύνη εξάγει μέσω σαφών οδηγιών, ενώ τα μοντέλα ανταμοιβής βαθμολόγησαν τις δημιουργούμενες αποκρίσεις με βάση παραμέτρους όπως η ακρίβεια και συνοχή. Αυτός ο επαναληπτικός μηχανισμός ανάδρασης αποδείχθηκε πολύτιμος για την εκπαίδευση μεγάλων γλωσσικών μοντέλων, την επιτάχυνση της ανάπτυξης και τη βελτίωση της αξιοπιστίας του μοντέλου.

Η πρωτοβουλία Nemotron-4 340B ενσωματώθηκε επίσης άψογα με την πλατφόρμα NeMo της NVIDIA και τη βιβλιοθήκη TensorRT-LLM, παρέχοντας στους χρήστες βελτιστοποίηση και ευελιξία στις ροές εργασίας AI τους. Τα συνθετικά δεδομένα που δημιουργήθηκαν από το Nemotron-4 340B έθεσαν τις βάσεις για τις πιο πρόσφατες ανακαλύψεις της NVIDIA σε πρακτορική και φυσική τεχνητή νοημοσύνη, γεφυρώνοντας την επιμέλεια δεδομένων, την εκπαίδευση μοντέλων και τις ανάγκες ανάπτυξης.

Llama Nemotron και Cosmos Nemotron: Expanding. Agentic AI

Οι νεότερες προσφορές της NVIDIA στο Η οικογένεια Nemotron — Llama Nemotron και Cosmos Nemotron — κινείται πέρα ​​από την απλή παραγωγή δεδομένων για να τροφοδοτήσει πράκτορες AI σε πραγματικό χρόνο. Τα μοντέλα μεγάλων γλωσσών Llama Nemotron (LLMs) εξυπηρετούν εργασίες όπως κωδικοποίηση, κλήση συναρτήσεων, συνομιλία και μαθηματικούς υπολογισμούς, ενώ τα μοντέλα γλώσσας όρασης Cosmos Nemotron (VLM) επικεντρώνονται στην ερμηνεία και την απόκριση σε οπτικά δεδομένα στο βίντεο, εικόνες και αισθητήρας feeds.

“Το Agentic AI είναι το επόμενο σύνορο της ανάπτυξης AI και η παροχή αυτής της ευκαιρίας απαιτεί βελτιστοποίηση πλήρους στοίβας σε ένα σύστημα LLMs για την παροχή αποτελεσματικών, ακριβών πρακτόρων AI”, δήλωσε ο Ahmad Ο Al-Dahle, αντιπρόεδρος και επικεφαλής της GenAI στη Meta, σε μια δήλωση «Μέσα από τη συνεργασία μας με την Nvidia και την κοινή μας δέσμευση για ανοιχτά μοντέλα, το Nvidia Llama. Η οικογένεια Nemotron που βασίζεται στο Llama μπορεί να βοηθήσει τις επιχειρήσεις να δημιουργήσουν γρήγορα τους δικούς τους προσαρμοσμένους πράκτορες AI.”

Nvidia Agentic AI αρχιτεκτονική (Εικόνα: Nvidia)

Αυτή η διπλή προσέγγιση ενσωματώνει εξειδικευμένες μικροϋπηρεσίες NVIDIA NIM που χειρίζονται εργασίες που απαιτούν μεγάλους πόρους, όπως η αναζήτηση βίντεο, η σύνοψη και η ερμηνεία αισθητήρων. Ενσωματώνοντας τη γλώσσα και την οπτική επεξεργασία, οι πράκτορες τεχνητής νοημοσύνης μπορούν να διαχειριστούν μια σειρά εφαρμογών, από την εφοδιαστική αποθήκης έως την ανάλυση ιατρικής απεικόνισης.

Cosmos World Foundation Models

Παράλληλα. οι οικογένειες Llama Nemotron και Cosmos Nemotron, η NVIDIA κυκλοφόρησε το Πλατφόρμα Cosmos World Foundation Model Model (WFM). Αυτή η νέα πλατφόρμα ειδικεύεται στη δημιουργία φωτορεαλιστικών βίντεο και περιβαλλόντων με βάση τη φυσική για ρομποτική, αυτόνομα οχήματα και γενικά σενάρια «φυσικής τεχνητής νοημοσύνης». Η εστίασή της σε ρεαλιστικές προσομοιώσεις μειώνει το κόστος που σχετίζεται με τη συλλογή και τη δοκιμή τεράστιων ποσοτήτων πραγματικών δεδομένων.

«Η στιγμή του ChatGPT για τη ρομποτική πλησιάζει, όπως τα μεγάλα γλωσσικά μοντέλα, τα παγκόσμια θεμελιώδη μοντέλα είναι θεμελιώδη για την πρόοδο ανάπτυξη ρομπότ και AV, ωστόσο δεν έχουν όλοι οι προγραμματιστές την τεχνογνωσία και τους πόρους για να εκπαιδεύσουν τους δικούς τους», σημείωσε ο Huang στην εναρκτήρια ομιλία του στο CES.

Οι προγραμματιστές μπορούν να χρησιμοποιήσουν Cosmos WFM για να δημιουργήσουν προσαρμοσμένα σενάρια, προσθέτοντας πολυπλοκότητες όπως π.χ. χιονισμένοι δρόμοι για συστήματα AV ή μποτιλιαρισμένα πατώματα αποθήκης για δοκιμές ρομποτικής. Αυτά τα σύνολα δεδομένων με γνώση της φυσικής μπορούν είτε να βελτιώσουν τα υπάρχοντα μοντέλα είτε να χρησιμεύσουν ως αυτόνομος πόρος εκπαίδευσης. Η εταιρεία έχει διαθέσει αυτά τα μοντέλα με άδεια ανοιχτού μοντέλου, με στόχο να διευρύνει την πρόσβαση σε προηγμένη ανάπτυξη τεχνητής νοημοσύνης.

Επιτάχυνση της φυσικής τεχνητής νοημοσύνης μέσω δεδομένων και υπολογιστικής απόδοσης

Η φυσική τεχνητή νοημοσύνη παραμένει υπολογιστικά απαιτητική, απαιτώντας δεδομένα υψηλής πιστότητας για την προσομοίωση του πραγματικού κόσμου. Το Cosmos αντιμετωπίζει αυτές τις προκλήσεις προσφέροντας μια ταχεία επεξεργασία βίντεο, προηγμένα tokenizers βίντεο (διαθέσιμα με άδεια ανοιχτού μοντέλου της NVIDIA, μέσω του Hugging Face και GitHub) και το NVIDIA NeMo Curator για επισήμανση και επιμέλεια δεδομένων.

Αυτός ο αγωγός στοχεύει στην επεξεργασία τεράστιων ποσοτήτων δεδομένων βίντεο—έως και 20 εκατομμύρια ώρες σε 14 ημέρες χρησιμοποιώντας την πλατφόρμα NVIDIA Blackwell—και όχι χρόνια λειτουργίας συνδεδεμένων με CPU.

Αυτά τα κέρδη αποτελεσματικότητας βοηθούν τους οργανισμούς που επιδιώκουν να αναπτύξουν, να δοκιμάσουν και να βελτιώσουν τα μοντέλα τεχνητής νοημοσύνης τους χωρίς να περιορίζονται από περιορισμούς δεδομένων του πραγματικού κόσμου. Το Cosmos Tokenizer συμπιέζει εικόνες και βίντεο, μειώνοντας τα έξοδα, διατηρώντας παράλληλα την απαραίτητη ποιότητα για την εκπαίδευση προηγμένων συστημάτων AI. Σύμφωνα με τη NVIDIA, αυτές οι βελτιστοποιήσεις ανοίγουν το δρόμο για ταχύτερη επανάληψη στη ρομποτική και στην έρευνα αυτόνομων οχημάτων.

Υιοθέτηση βιομηχανίας

Οι σημαντικότεροι παίκτες στη ρομποτική και την τεχνολογία αυτοκινήτων έχουν έδειξε έντονο ενδιαφέρον για το Cosmos. Εταιρείες όπως 1X, Agile Robots, Agility, Figure AI, Foretellix, Uber, Waabi και XPENG είναι μεταξύ εκείνων που ενσωματώνουν τη νέα πλατφόρμα στους αγωγούς ανάπτυξής τους.

Για παράδειγμα, η XPENG σχεδιάζει να βελτιώσει την ανθρωποειδή ρομποτική της. πρωτοβουλίες, ενώ ο γίγαντας Uber συνεργάζεται με την NVIDIA για να αξιοποιήσει το Cosmos για καλύτερη επεξεργασία δεδομένων και δημιουργία σεναρίων. «Η γενετική τεχνητή νοημοσύνη θα τροφοδοτήσει το μέλλον της κινητικότητας, απαιτώντας πλούσια δεδομένα και πολύ ισχυρούς υπολογιστές», δήλωσε ο Dara Khosrowshahi, Διευθύνων Σύμβουλος της Uber. «Σε συνεργασία με την NVIDIA, είμαστε βέβαιοι ότι μπορούμε να συμβάλουμε στην υπερφόρτιση του χρονοδιαγράμματος για ασφαλή και επεκτάσιμη αυτόνομη οδήγηση λύσεις για τον κλάδο.”

Εταιρείες όπως η SAP και η ServiceNow έχουν υιοθετήσει με παρόμοιο τρόπο την NVIDIA Οικογένειες Nemotron. «Οι πράκτορες τεχνητής νοημοσύνης που συνεργάζονται για την επίλυση σύνθετων εργασιών σε πολλαπλούς τομείς της επιχείρησης θα ξεκλειδώσουν ένα εντελώς νέο επίπεδο παραγωγικότητας της επιχείρησης πέρα ​​από τα σημερινά σενάρια τεχνητής νοημοσύνης», δήλωσε ο Philipp Herzig, επικεφαλής τεχνητής νοημοσύνης στη SAP, σε μια δήλωση. εκατοντάδες εκατομμύρια εταιρικοί χρήστες θα αλληλεπιδράσουν με αυτούς τους πράκτορες για να επιτύχουν τους στόχους τους πιο γρήγορα από ποτέ.”

Ένταξη NeMo, Ανοιχτή Άδεια Χρήσης και Μέτρα Ασφάλειας

Όλα τα μοντέλα Cosmos WFM και Nemotron διασυνδέονται με το Πλαίσιο NeMo, που επιτρέπει τη λεπτομέρεια, τη στοίχιση, και επαυξημένη παραγωγή ανάκτησης (RAG). Μέσω του NeMo Curator, οι προγραμματιστές μπορούν να επεξεργάζονται δεδομένα βίντεο μεγάλης κλίμακας, ενώ η ενισχυτική μάθηση από την ανθρώπινη ανατροφοδότηση (RLHF) βελτιώνει τα μοντέλα ώστε να διατηρούνται κατάλληλες, βασισμένες στο περιβάλλον, αποκρίσεις.

Η NVIDIA κυκλοφόρησε το Cosmos με άδεια ανοιχτού μοντέλου, ενθαρρύνοντας τη συνεργασία και την προσαρμογή στην κοινότητα ρομποτικής και AV. Η εταιρεία σημείωσε επίσης μέτρα για ασφαλή και υπεύθυνη τεχνητή νοημοσύνη, συμπεριλαμβανομένης της υδατογράφησης περιεχομένου που δημιουργείται από τεχνητή νοημοσύνη, της εφαρμογής προστατευτικών κιγκλιδωμάτων για τον μετριασμό επιβλαβών κειμένων ή εικόνων και της ευθυγράμμισης με παγκόσμιες πρωτοβουλίες για την ασφάλεια της τεχνητής νοημοσύνης.

«Είμαστε βέβαιοι ότι μπορούμε να βοηθήσουμε. συμπληρώστε το χρονοδιάγραμμα για ασφαλείς και επεκτάσιμες λύσεις αυτόνομης οδήγησης για τον κλάδο», πρόσθεσε ο Khosrowshahi, υπογραμμίζοντας την αυξανόμενη έμφαση στο αξιόπιστα, διαφανή συστήματα AI.

Προς ένα ενοποιημένο οικοσύστημα AI

Με τη συγχώνευση της προσέγγισης που βασίζεται σε συνθετικά δεδομένα του Nemotron-4 340B με το νέο Cosmos WFM πλατφόρμα, η NVIDIA ορίζει μια ενοποιημένη διαδρομή για την τεχνητή νοημοσύνη που καλύπτει την έρευνα, την ανάπτυξη των επιχειρήσεων και τον φυσικό αυτοματισμό Οι οικογένειες Cosmos Nemotron αναλαμβάνουν βασικούς ρόλους στην τεχνητή νοημοσύνη, ενώ τα Cosmos WFM αντιμετωπίζουν την πολυπλοκότητα της ρομποτικής και της αυτόνομης ανάπτυξης οχημάτων.

Από τη δυνατότητα παραγωγής οικονομικά αποδοτικών δεδομένων έως την προσφορά εξειδικευμένων μικροϋπηρεσιών για εργασίες γλώσσας και όρασης σε πραγματικό χρόνο, Το τελευταίο χαρτοφυλάκιο της NVIDIA αποτελεί παράδειγμα μιας ευέλικτης στρατηγικής για την πρόοδο της τεχνητής νοημοσύνης. Καθώς περισσότερες επιχειρήσεις, προγραμματιστές και ερευνητές υιοθετούν αυτά τα μοντέλα, η τροχιά για αυτόνομα συστήματα και ευφυείς πράκτορες λογισμικού φαίνεται έτοιμη να επιταχυνθεί.

Categories: IT Info