Το OpenAI έχει ξεκινήσει αναβαθμισμένα μοντέλα ομιλίας σε κείμενο και κειμένου σε ομιλία, βελτιώνοντας την ακρίβεια της μεταγραφής και την επέκταση των επιλογών προσαρμογής για τις φωνητικές εφαρμογές. Τεχνολογία, με Google, Microsoft και αναδυόμενους παίκτες όπως το Sesame AI που πιέζει τα όρια του συνθετικού ρεαλισμού φωνής. Src=”Δεδομένα: Εικόνα/SVG+XML; Nitro-Empty-ID=MTY4OTOXOTA4-1, BASE64, PHN2ZYB2AWV3QM94PSIWIDAGMTAYNCA2MT Aiihdpzhropsixmdi0iibozwlnahq9ijyxmcigeg1sbnm9imh0dha6ly93d3cudzmub3jnlziwmdavc3znij48l3n2zz4=”>>

Βελτιωμένο λόγο σε κείμενο: Διορθώσεις σφαλμάτων μεταγραφής και ψευδαισθήσεις AI

Το νέο axios αναφορές Η αναπαραγωγή μιας φωνής με λίγα δευτερόλεπτα ήχου έχει δημιουργήσει συναγερμούς μεταξύ των εμπειρογνωμόνων στον κυβερνοχώρο.

Το ίδιο το OpenAi αντιμετώπισε κριτική υψηλού προφίλ για τη φωνητική ηθική. Τον Μάιο του 2024, η εταιρεία απομάκρυνε μία από τις φωνές της που δημιουργήθηκε από το AI, ο Sky, αφού οι χρήστες σημείωσαν την ομοιότητά της με την ηθοποιό Scarlett Johansson. Ο Johansson δήλωσε αργότερα ότι «ποτέ δεν έδωσε την άδεια στο OpenAi να χρησιμοποιήσει τη φωνή της». Ωστόσο, η εταιρεία δεν έχει ακόμη παράσχει πλήρη διαφάνεια στις ακριβείς διασφαλίσεις που έχει εφαρμόσει για να αποτρέψει την μη εξουσιοδοτημένη φωνητική αναπαραγωγή. Η εταιρεία έχει ενσωματώσει αυτά τα μοντέλα με το Agent SDK βρίσκονται σε εξέλιξη σε ολόκληρο τον κλάδο. Financial Times Εν τω μεταξύ, Η Google είναι η γενετική AI σε εφαρμογές παραγωγικότητας Το οικοσύστημα Copilot

με τις φωνές που παράγονται από το AI καθίστανται ολοένα και πιο αδιάκριτες από την ανθρώπινη ομιλία, η ισορροπία μεταξύ της τεχνολογικής προόδου και της υπεύθυνης ανάπτυξης παραμένει ένα κρίσιμο ζήτημα. Τα τελευταία μοντέλα του OpenAI παρουσιάζουν σαφείς εξελίξεις στον ρεαλισμό και τη χρηστικότητα, αλλά οι ηθικές και ασφάλισης ανησυχιών που περιβάλλουν τη σύνθεση φωνής που οδηγούνται από το AI, απέχουν πολύ από το επιλυμένο.

Categories: IT Info