Η Microsoft έχει αποκαλύψει δύο νέα εσωτερικά αναπτυγμένα μοντέλα AI, σηματοδοτώντας ένα σημαντικό βήμα στη στρατηγική της για την κατασκευή ιδιόκτητου AI παράλληλα με τη συνεργασία της με την OpenAI. Ανακοινώθηκε την Πέμπτη, τα μοντέλα περιλαμβάνουν το Mai-Voice-1, ένα εξαιρετικά αποδοτικό εργαλείο παραγωγής ομιλίας και το Mai-1-Preview, το πρώτο μοντέλο του θεμελιώδους κειμένου της εταιρείας. Τα νέα μοντέλα σηματοδοτούν τη φιλοδοξία της Microsoft να γίνει ηγέτης τόσο στην AI Application όσο και στη θεμελιώδη έρευνα, δίνοντάς του μεγαλύτερο έλεγχο στον τεχνολογικό χάρτη πορείας του. Υπογραμμίζει έναν στρατηγικό άξονα για την ανάπτυξη των δυνατοτήτων εσωτερικού χώρου για να συμπληρώσει την επένδυση πολλών δισεκατομμυρίων δολαρίων στο OpenAi. Η νέα, υπερ-αποδοτική φωνή για το Copilot

Το πρώτο από τα νέα μοντέλα, Mai-Voice-1, τοποθετείται ως ένα”εξαιρετικά εκφραστικό και φυσικό”σύστημα παραγωγής ομιλίας. Η επίσημη ανακοίνωση της Microsoft υπογραμμίζει την αξιοσημείωτη αποτελεσματικότητά της, υποστηρίζοντας ότι μπορεί να δημιουργήσει ένα πλήρες λεπτό ήχου υψηλής ποιότητας σε ένα δεύτερο σε ένα μόνο GPU. Αυτή η μέτρηση απόδοσης το καθιστά ένα από τα πιο αποτελεσματικά και”αστραπιαία”συστήματα ομιλίας που διατίθενται σήμερα. Το Mai-Voice-1 έχει σχεδιαστεί για να επιτύχει αυτό το όραμα με την παραγωγή εκφραστικού ήχου κατάλληλου τόσο για σενάρια μεμονωμένα όσο και για πολλαπλούς ομιλητές, μια βασική ικανότητα για τη δημιουργία δυναμικών και διαδραστικών εμπειριών AI. Η τεχνολογία ενσωματώνεται ήδη στη σειρά προϊόντων της Microsoft. Το Mai-Voice-1 τροφοδοτεί τα χαρακτηριστικά του Copilot Daily και των podcasts, προσφέροντας πιο φυσικές φωνές σε χρήστες που αλληλεπιδρούν καθημερινά με αυτές τις υπηρεσίες. Αυτή η εμπειρία επιτρέπει σε οποιονδήποτε να Επικάλυψη κειμένου, επιλέξτε φωνές και στυλ και κατεβάστε την έξοδο . Η εταιρεία προτείνει να χρησιμοποιήσετε περιπτώσεις από τη δημιουργία ιστοριών”Επιλέξτε τη δική σας περιπέτεια”για να καθοδηγήσετε διαλογισμούς. Η Microsoft το περιγράφει ως το μοντέλο First Foundation trai enwo–inewser end-to-end εξ ολοκλήρου μέσα στα δικά του εργαστήρια. Αυτή η κίνηση είναι ένα κρίσιμο βήμα για την οικοδόμηση ανεξάρτητου μυός ανάπτυξης AI και προσφέρει αυτό που η εταιρεία ονομάζει”ματιά των μελλοντικών προσφορών μέσα στο copilot”. Η ανάπτυξή του περιελάμβανε μια τεράστια επένδυση υλικού, καθώς ήταν προ-εκπαιδευμένη και μετα-εκπαιδευμένη σε ένα σύμπλεγμα περίπου 15.000 από τις εξαιρετικά περιζήτητες GPU της Nvidia. Η εταιρεία ισχυρίζεται ότι το μοντέλο υπερέχει στην εξειδίκευση στις ακόλουθες οδηγίες και στην παροχή χρήσιμων απαντήσεων στις καθημερινές ερωτήσεις των χρηστών, τοποθετώντας το ως ένα πρακτικό και χρήσιμο εργαλείο για ένα ευρύ κοινό. Έχει ανοίξει το Mai-1-Preview σε δημόσιο έλεγχο στη Lmarena, μια δημοφιλής κοινοτική πλατφόρμα για τη συγκριτική αξιολόγηση των μοντέλων AI εναντίον του άλλου. Αυτή η διαφανής προσέγγιση επιτρέπει την άμεση σύγκριση και την αμερόληπτη ανατροφοδότηση από την ευρύτερη κοινότητα AI. Τις ερχόμενες εβδομάδες, θα κυκλοφορήσει για να χειριστεί ορισμένες εργασίες που βασίζονται σε κείμενο στο Copilot. Ο δηλωμένος στόχος είναι να μάθει από τα σχόλια των χρηστών για τη βελτίωση του μοντέλου. Για τους προγραμματιστές και τους ερευνητές, η Microsoft προσφέρει επίσης Περιορισμένη πρόσβαση API μέσω μιας διαδικασίας εφαρμογής

Παρά αυτή τη σημαντική ώθηση στην εγχώρια AI, η Microsoft επιβεβαιώνει δημοσίως τη δέσμευσή της στο OpenAI. Τα στελέχη της εταιρείας ήταν σαφές ότι η MAI-1-PREVIEW δεν προορίζεται να αντικαταστήσει τα ισχυρά μοντέλα GPT που στηρίζουν σήμερα πολλές από τις υπηρεσίες της. Αυτό υποδηλώνει μια στρατηγική διαφοροποίησης και όχι αντικατάστασης, όπου η Microsoft μπορεί να επιλέξει το καλύτερο εργαλείο για οποιαδήποτε δεδομένη εργασία, είτε πρόκειται για συνεργάτη, κοινότητα ανοιχτού κώδικα είτε για τα δικά της εργαστήρια. Η επίσημη ανάρτηση ιστολογίου της εταιρείας αντέδρασε αυτό το συναίσθημα, υπογραμμίζοντας μια αποστολή για τη δημιουργία τεράστιων θετικών επιπτώσεων. Η ομάδα της Microsoft AI δήλωσε:”Είμαστε επίσης τυχεροί να συνεργαστούμε με απίστευτες ομάδες προϊόντων που δίνουν στα μοντέλα μας την ευκαιρία να φτάσουμε σε δισεκατομμύρια χρήστες και να δημιουργήσουμε τεράστιες θετικές επιπτώσεις.”Η Microsoft επιβεβαίωσε ότι το σύμπλεγμα της επόμενης γενιάς των GPU της NVIDIA GB200 λειτουργεί τώρα, ανοίγοντας το δρόμο για ακόμη πιο φιλόδοξα μοντέλα. Ο Suleyman επιβεβαίωσε την αφοσίωση της εταιρείας, λέγοντας:”Έχουμε έναν τεράστιο πενταετή οδική χάρτη που επενδύουμε το τρίμηνο μετά το τρίμηνο. Η Openai αναβάθμισε πρόσφατα τις δικές του φωνητικές δυνατότητες με το API σε πραγματικό χρόνο, ενώ εταιρείες όπως η ανθρωπότητα, το Mistral και ακόμη και η Amazon αγωνίζονται για κυριαρχία στο ταχέως εξελισσόμενο πεδίο του γενετικού AI. Η κίνηση της Microsoft είναι ένα σαφές σήμα που σκοπεύει να ανταγωνιστεί σε όλα τα μέτωπα.

Categories: IT Info