ElevenLabs wprowadziło Projects, narzędzie oparte na sztucznej inteligencji, którego celem jest upraszczając generowanie i edycję długich plików audio, takich jak audiobooki. Opiera się na badaniach firmy nad syntezą długich form mowy, kondycjonowaniem dźwięku i równoległym generowaniem dźwięku.
[treść osadzona]
Rozwiązywanie problemów poprzednich użytkowników
Przed wprowadzeniem Projektów użytkownicy zgłaszali problemy, takie jak problemy ze stabilnością podczas tworzenia rozszerzonych treści i trudności w łączeniu fragmentów tekstu wypowiadanych różnymi głosami. Poprzednie ograniczenia platformy utrudniały także ponowne wygenerowanie określonych sekcji audio i ograniczały użytkowników do określonych formatów plików tekstowych.
Projects stara się rozwiązać te problemy, oferując takie funkcje, jak:
Generowanie całych audiobooków jednym kliknięciem. Przypisywanie fragmentów tekstu konkretnym mówcom z zachowaniem kontekstu. Dostosowywanie długości pauz dla stymulacji. Selektywna regeneracja fragmentów audio bez konieczności powtarzania całych sekwencji. Obsługa formatów plików.epub,.pdf,.txt i inicjowanie projektów w oparciu o adresy URL.
Funkcje i kompatybilność
Narzędzie zapewnia szereg funkcji, w tym pełne możliwości konwersji, przypisywanie głośników, regenerację segmentów, ręczne dostosowywanie pauz, segmentację rozdziałów oraz zapisywanie i funkcję wznowienia. Obsługuje także importowanie plików z różnych formatów i adresów URL.
Pod względem kompatybilności Projects integruje się z istniejącymi narzędziami ElevenLabs, takimi jak synteza mowy, VoiceLab i biblioteka głosowa. Dodatkowo działa w połączeniu z profesjonalnym klonowaniem głosu, biblioteką głosową i wielojęzycznym modelem ElevenLabs.