Το OpenAI ενισχύει τα μοντέλα ομιλίας AI με πιο ρεαλιστικές φωνές και βελτιωμένη μεταγραφή

Το OpenAI έχει ξεκινήσει αναβαθμισμένα μοντέλα ομιλίας σε κείμενο και κειμένου σε ομιλία, βελτιώνοντας την ακρίβεια της μεταγραφής και την επέκταση των επιλογών προσαρμογής για τις φωνητικές εφαρμογές. Τεχνολογία, με Google, Microsoft και αναδυόμενους παίκτες όπως το Sesame AI που πιέζει τα όρια του συνθετικού ρεαλισμού φωνής. Src=”Δεδομένα: Εικόνα/SVG+XML; Nitro-Empty-ID=MTY4OTOXOTA4-1, BASE64, PHN2ZYB2AWV3QM94PSIWIDAGMTAYNCA2MT Aiihdpzhropsixmdi0iibozwlnahq9ijyxmcigeg1sbnm9imh0dha6ly93d3cudzmub3jnlziwmdavc3znij48l3n2zz4=”>>

Βελτιωμένο λόγο σε κείμενο: Διορθώσεις σφαλμάτων μεταγραφής και ψευδαισθήσεις AI

Το νέο axios αναφορές Η αναπαραγωγή μιας φωνής με λίγα δευτερόλεπτα ήχου έχει δημιουργήσει συναγερμούς μεταξύ των εμπειρογνωμόνων στον κυβερνοχώρο.

Το ίδιο το OpenAi αντιμετώπισε κριτική υψηλού προφίλ για τη φωνητική ηθική. Τον Μάιο του 2024, η εταιρεία απομάκρυνε μία από τις φωνές της που δημιουργήθηκε από το AI, ο Sky, αφού οι χρήστες σημείωσαν την ομοιότητά της με την ηθοποιό Scarlett Johansson. Ο Johansson δήλωσε αργότερα ότι «ποτέ δεν έδωσε την άδεια στο OpenAi να χρησιμοποιήσει τη φωνή της». Ωστόσο, η εταιρεία δεν έχει ακόμη παράσχει πλήρη διαφάνεια στις ακριβείς διασφαλίσεις που έχει εφαρμόσει για να αποτρέψει την μη εξουσιοδοτημένη φωνητική αναπαραγωγή. Η εταιρεία έχει ενσωματώσει αυτά τα μοντέλα με το Agent SDK βρίσκονται σε εξέλιξη σε ολόκληρο τον κλάδο. Financial Times Εν τω μεταξύ, Η Google είναι η γενετική AI σε εφαρμογές παραγωγικότητας Το οικοσύστημα Copilot

με τις φωνές που παράγονται από το AI καθίστανται ολοένα και πιο αδιάκριτες από την ανθρώπινη ομιλία, η ισορροπία μεταξύ της τεχνολογικής προόδου και της υπεύθυνης ανάπτυξης παραμένει ένα κρίσιμο ζήτημα. Τα τελευταία μοντέλα του OpenAI παρουσιάζουν σαφείς εξελίξεις στον ρεαλισμό και τη χρηστικότητα, αλλά οι ηθικές και ασφάλισης ανησυχιών που περιβάλλουν τη σύνθεση φωνής που οδηγούνται από το AI, απέχουν πολύ από το επιλυμένο.

Το OpenAI ενισχύει τα μοντέλα ομιλίας AI με πιο ρεαλιστικές φωνές και βελτιωμένη μεταγραφή

Published by All Things Windows on March 20, 2025

Βελτιωμένο λόγο σε κείμενο: Διορθώσεις σφαλμάτων μεταγραφής και ψευδαισθήσεις AI

IT Info

Το Github Action Breach εκθέτει μυστικά σε εκατοντάδες αποθετήρια

IT Info

Ο νέος καιρός AI υπόσχεται ταχύτερη πρόβλεψη χαμηλού κόστους χωρίς υπερυπολογιστές

IT Info

Η Microsoft πέρασε την επιλογή CoreWeave 12 δισεκατομμυρίων δολαρίων, αναβάλλοντας τη συμφωνία υποδομής AI στο OpenAI

Το OpenAI ενισχύει τα μοντέλα ομιλίας AI με πιο ρεαλιστικές φωνές και βελτιωμένη μεταγραφή

Published by All Things Windows on March 20, 2025

Βελτιωμένο λόγο σε κείμενο: Διορθώσεις σφαλμάτων μεταγραφής και ψευδαισθήσεις AI

Related Posts

IT Info

Το Github Action Breach εκθέτει μυστικά σε εκατοντάδες αποθετήρια

IT Info

Ο νέος καιρός AI υπόσχεται ταχύτερη πρόβλεψη χαμηλού κόστους χωρίς υπερυπολογιστές

IT Info

Η Microsoft πέρασε την επιλογή CoreWeave 12 δισεκατομμυρίων δολαρίων, αναβάλλοντας τη συμφωνία υποδομής AI στο OpenAI