Η Microsoft κυκλοφόρησε το Vibevoice, ένα νέο μοντέλο AI ανοιχτού κώδικα που δημιουργεί φυσικό ήχο μακράς μορφής με πολλαπλά ηχεία. Ανακοινώθηκε στα τέλη Αυγούστου, το εργαλείο μπορεί να δημιουργήσει έως και 90 λεπτά ομιλίας χρησιμοποιώντας τέσσερις ξεχωριστές φωνές, καθιστώντας το ιδανικό για podcasts ή εκπαιδευτικά υλικά. Για να αποφευχθεί η κατάχρηση, η Microsoft έχει ενσωματωθεί σε χαρακτηριστικά ασφαλείας όπως η Audible AI Disclapeners και ένα
Η κίνηση προσφέρει ένα ισχυρό νέο εργαλείο για τους δημιουργούς και τους ερευνητές, σηματοδοτώντας την αυξανόμενη φιλοδοξία της εταιρείας να αναπτύξουν θεμελιώδη μοντέλα AI στο σπίτι και να προωθήσουν μια ανοιχτή ερευνητική κοινότητα γύρω από τον γενετικό ήχο. Src=”Δεδομένα: Εικόνα/SVG+XML, Nitro-Empty-ID=MTYZOTO5NDC=-1, BASE64, PHN2ZYB2AWV3QM94PSIWIDAGMTI4MCA2MZ kiihdpzhropsixmjgwiibozwlnahq9ijyzoSigeg1sbnmm9imh0dha6ly93d3cudzmub3jnlziwmdavc3znij48l3n2zz4=”>> Vibevo’s Core Innoviation συνεκτικό και φυσικό. Το μοντέλο μπορεί να συνθέσει έως και 90 λεπτά συνεχούς ομιλίας με έως και τέσσερις ξεχωριστές φωνές, ένα Αυτό γίνεται δυνατό από μια εξελιγμένη αρχιτεκτονική. Χρησιμοποιεί ένα μοντέλο παραμέτρων 1,5 δισεκατομμυρίων, το οποίο είναι
Vibevoice: Ένα στούντιο podcast πολλαπλών ηχείων σε ένα GPU
Categories: IT Info