Microsoft telah meluncurkan empat suara saraf AI inovatif untuk aplikasi text-to-speech (TTS), yang dirancang khusus untuk integrasi dengan Azure OpenAI Service. Suara-suara ini dirancang untuk menyempurnakan chatbot, asisten suara, dan agen percakapan berbasis ucapan.

Suara yang Dioptimalkan untuk Skenario Percakapan

Suara-suara yang baru diperkenalkan diberi nama en-US-AndrewNeural, en-US-BrianNeural, en-US-EmmaNeural (semua dalam bahasa Inggris AS), dan zh-CH-YunjieNeural (Cina). Suara-suara ini telah disesuaikan untuk konteks percakapan dan saat ini tersedia untuk pratinjau publik di tiga wilayah: AS Timur, Asia Tenggara, dan Eropa Barat. Microsoft telah memberikan contoh suara-suara ini, menyoroti kemajuan mereka dalam menyampaikan ucapan yang lebih alami dan lancar dibandingkan dengan suara saraf yang sudah ada.

“…ramah, dan optimis terhadap kehidupan, selalu bersemangat membantu orang lain dan berbagi hal-hal menarik atau praktis pengetahuan. Gaya bicara suaranya menyerupai percakapan dengan seorang kenalan sambil minum teh, mempertahankan nada alami dan tidak berlebihan.”Pernyataan dari Microsoft ini menekankan persona dan nada di balik setiap suara.

Kemajuan Teknologi di Balik Suara

Upaya berkelanjutan Microsoft untuk menyempurnakan teknik pemodelan Text-to-Speech (TTS) telah menghasilkan peningkatan yang signifikan dalam kualitas suara AI. Proyek terbaru seperti DelightfulTTS 2 dan MuLanTTS telah menjembatani kesenjangan kualitas antara suara AI dan rekaman manusia profesional. telah memainkan peran penting dalam menghasilkan suara yang terdengar lebih alami dan realistis. Kemajuan teknologi tersebut menjadi landasan bagi suara AI yang baru diperkenalkan.

Pengembang dapat dengan mudah mengintegrasikan suara-suara ini ke dalam aplikasi mereka menggunakan Azure Speech SDK atau REST API. Azure Bot Framework juga menawarkan kemampuan untuk membuat bot cerdas yang dapat memanfaatkan suara TTS saraf baru ini.

Penawaran ekstensif Microsoft mencakup lebih dari 400 suara saraf, yang mencakup lebih dari 140 bahasa dan lokal. Beragamnya pilihan ini memastikan developer dan bisnis memiliki banyak pilihan untuk memberikan pengalaman percakapan yang lebih kaya kepada penggunanya.

Categories: IT Info