VideoLAN, organizacja non-profit stojąca za popularnym na całym świecie odtwarzaczem multimedialnym VLC, zaprezentowała na targach CES 2025 istotną nową funkcję.
Nowe narzędzie umożliwia generowanie i tłumaczenie napisów w czasie rzeczywistym przy użyciu sztucznej inteligencji, a wszystko to bez konieczności połączenia z Internetem. Jean-Baptiste Kempf, prezes VideoLAN, opisał system jako zaprojektowany z myślą o prywatności i funkcjonalności użytkownika: „Ważne jest, aby działał on na Twoim komputerze lokalnie, w trybie offline, bez żadnych usług w chmurze. Działa bezpośrednio w pliku wykonywalnym.”
Automatyczne generowanie i tłumaczenie napisów VLC w oparciu o lokalne i otwarte modele AI działające na Twoim komputerze, działające w trybie offline i obsługujące wiele języków!
Demo może być można znaleźć na naszym #CES2025 stoisku Park Eureka pic.twitter.com/UVmgT6K4ds— VideoLAN (@videolan) 8 stycznia 2025 r.
To kluczowy krok w zwiększaniu dostępności ogromnej liczby VLC użytkowników, zachowując jednocześnie wieloletnie zaangażowanie organizacji w zasady prywatności i otwartego oprogramowania.
Powiązane: Przeglądarka Microsoft Edge dodaje dubbing na żywo i napisy do filmów
Napisy AI ułatwiające dostęp do multimediów
Sztuczna inteligencja Narzędzie napisów przetwarza treść wideo bezpośrednio na urządzeniu użytkownika, korzystając z lokalnie działających modeli. To zlokalizowane podejście eliminuje potrzebę korzystania z usług w chmurze, zmniejszając opóźnienia i zapewniając, że dane użytkownika nigdy nie opuszczą urządzenia.
Nowa funkcja może tłumaczyć napisy na ponad 100 języków, co demonstruje jej potencjał w zakresie dostępności dla odbiorców na całym świecie. System może zarówno generować napisy, jak i tłumaczyć je na preferowany język użytkownika w czasie rzeczywistym.
Wcześniej generowanie napisów w VLC opierało się na zewnętrznych wtyczkach, takich jak Whisper OpenAI, powszechnie uznawane narzędzie do rozpoznawania mowy przeznaczony do transkrypcji i tłumaczenia dźwięku. Integrując podobną funkcjonalność bezpośrednio z oprogramowaniem VLC, VideoLAN stworzył rozwiązanie, które jest zarówno bezpieczniejsze, jak i wygodniejsze dla użytkowników.
Na targach CES 2025 firma VideoLAN zademonstrowała zdolność funkcji napisów AI do tłumaczenia napisów w czasie rzeczywistym. Obsługiwane języki to między innymi niemiecki, hebrajski, japoński i francuski.
Chociaż pełna lista obsługiwanych języków i specyfikacji technicznych nie została jeszcze opublikowana, firma obiecała dodatkowe szczegóły w nadchodzącym poście na blogu. Kempf wyjaśnił, że celem jest zapewnienie dostępności narzędzia dla jak największej liczby użytkowników, niezależnie od ich lokalizacji i języka.
Bez względu na to, czy użytkownicy przesyłają strumieniowo zagraniczne filmy, czy korzystają z treści edukacyjnych, narzędzie AI do napisów zapewnia potencjał rozszerzenia użyteczności VLC na różne grupy odbiorców i konteksty.
Powiązane: Microsoft PowerPoint otrzymuje obsługę napisów SRT w celu zapewnienia lepszej dostępności wideo
Lokalny model AI Przetwarzanie
Technologia, na której opierają się napisy AI w VLC, opiera się na lokalnie działających modelach sztucznej inteligencji, co jest decyzją zakorzenioną w prywatności i praktyczności. W przeciwieństwie do systemów opartych na chmurze, które wymagają stałego połączenia z Internetem i wysyłają dane użytkownika na serwery zewnętrzne, modele lokalne przetwarzają informacje wyłącznie na urządzeniu użytkownika.
Ta konfiguracja nie tylko zwiększa prywatność, ale także zapewnia funkcjonalność w regionach o ograniczonym lub zawodnym dostępie do Internetu.
Lokalne modele sztucznej inteligencji, takie jak te prezentowane w tym systemie, są coraz bardziej preferowane ze względu na swoje zdolność do działania niezależnie od infrastruktury zewnętrznej. Konstrukcja ta jest szczególnie cenna w zastosowaniach wymagających szybkiego przetwarzania lub takich, w których priorytetem jest prywatność użytkownika.
Dla użytkowników oznacza to większą wydajność, mniejszą zależność od łączności internetowej i pewność, że ich dane pozostaną bezpieczne.
Dziedzictwo innowacji VLC
VLC, uruchomiony po raz pierwszy w 1996 roku jako projekt studencki w Ecole Centrale Paris, stał się jednym z najczęściej pobieranych i powszechnie używanych odtwarzaczy multimedialnych typu open source na świecie.
Początkowo projekt miał na celu umożliwienie przesyłania strumieniowego wideo na terenie kampusu uniwersyteckiego, ale przekształcił się w aplikację wieloplatformową obsługującą praktycznie wszystkie formaty multimediów. Jak zauważył Kempf: „Liczba aktywnych użytkowników VLC faktycznie rośnie, nawet w epoce usług przesyłania strumieniowego”.
Podczas ogłoszenia na targach CES firma VideoLAN świętowała przekroczenie 6 miliardów pobrań, co stanowiło kamień milowy w przypadku kilku narzędzi programowych osiągnąć trwałą popularność VLC wynika z jego prostoty, szerokiej kompatybilności i zaangażowania w bycie darmowym, wolnym od reklam i pozbawionym jakichkolwiek komercyjnych źródeł przychodów.
Wizja skupiająca się na prywatności. Przyszłość
Podejście VLC do napisów AI jest zgodne z szerszym zaangażowaniem VideoLAN w kwestie prywatności i autonomii użytkowników. Zapewniając, że całe przetwarzanie odbywa się lokalnie, organizacja w dalszym ciągu priorytetowo traktuje kontrolę swoich użytkowników nad ich własnymi danymi. Filozofia ta odegrała kluczową rolę w sukcesie VLC i pozostaje podstawowym elementem jej tożsamości w erze coraz bardziej zdominowanej przez usługi zależne od chmury.
Ogłoszenie VideoLAN na targach CES podkreśla, w jaki sposób projekty typu open source mogą pozostać konkurencyjne i istotne w szybko zmieniającym się środowisku technologicznym. W miarę ciągłego rozwoju VLC nowa funkcja napisów AI służy zarówno jako postęp technologiczny, jak i potwierdzenie jego podstawowych zasad.