VideoLAN, organizacja non-profit stojąca za popularnym na całym świecie odtwarzaczem multimedialnym VLC, zaprezentowała na targach CES 2025 istotną nową funkcję.

Nowe narzędzie umożliwia generowanie i tłumaczenie napisów w czasie rzeczywistym przy użyciu sztucznej inteligencji, a wszystko to bez konieczności połączenia z Internetem. Jean-Baptiste Kempf, prezes VideoLAN, opisał system jako zaprojektowany z myślą o prywatności i funkcjonalności użytkownika: „Ważne jest, aby działał on na Twoim komputerze lokalnie, w trybie offline, bez żadnych usług w chmurze. Działa bezpośrednio w pliku wykonywalnym.”

Automatyczne generowanie i tłumaczenie napisów VLC w oparciu o lokalne i otwarte modele AI działające na Twoim komputerze, działające w trybie offline i obsługujące wiele języków!
Demo może być można znaleźć na naszym #CES2025 stoisku Park Eureka pic.twitter.com/UVmgT6K4ds

— VideoLAN (@videolan) 8 stycznia 2025 r.

To kluczowy krok w zwiększaniu dostępności ogromnej liczby VLC użytkowników, zachowując jednocześnie wieloletnie zaangażowanie organizacji w zasady prywatności i otwartego oprogramowania.

Powiązane: Przeglądarka Microsoft Edge dodaje dubbing na żywo i napisy do filmów

Napisy AI ułatwiające dostęp do multimediów

Sztuczna inteligencja Narzędzie napisów przetwarza treść wideo bezpośrednio na urządzeniu użytkownika, korzystając z lokalnie działających modeli. To zlokalizowane podejście eliminuje potrzebę korzystania z usług w chmurze, zmniejszając opóźnienia i zapewniając, że dane użytkownika nigdy nie opuszczą urządzenia.

Nowa funkcja może tłumaczyć napisy na ponad 100 języków, co demonstruje jej potencjał w zakresie dostępności dla odbiorców na całym świecie. System może zarówno generować napisy, jak i tłumaczyć je na preferowany język użytkownika w czasie rzeczywistym.

Wcześniej generowanie napisów w VLC opierało się na zewnętrznych wtyczkach, takich jak Whisper OpenAI, powszechnie uznawane narzędzie do rozpoznawania mowy przeznaczony do transkrypcji i tłumaczenia dźwięku. Integrując podobną funkcjonalność bezpośrednio z oprogramowaniem VLC, VideoLAN stworzył rozwiązanie, które jest zarówno bezpieczniejsze, jak i wygodniejsze dla użytkowników.

Na targach CES 2025 firma VideoLAN zademonstrowała zdolność funkcji napisów AI do tłumaczenia napisów w czasie rzeczywistym. Obsługiwane języki to między innymi niemiecki, hebrajski, japoński i francuski.

Chociaż pełna lista obsługiwanych języków i specyfikacji technicznych nie została jeszcze opublikowana, firma obiecała dodatkowe szczegóły w nadchodzącym poście na blogu. Kempf wyjaśnił, że celem jest zapewnienie dostępności narzędzia dla jak największej liczby użytkowników, niezależnie od ich lokalizacji i języka.

Bez względu na to, czy użytkownicy przesyłają strumieniowo zagraniczne filmy, czy korzystają z treści edukacyjnych, narzędzie AI do napisów zapewnia potencjał rozszerzenia użyteczności VLC na różne grupy odbiorców i konteksty.

Powiązane: Microsoft PowerPoint otrzymuje obsługę napisów SRT w celu zapewnienia lepszej dostępności wideo

Lokalny model AI Przetwarzanie

Technologia, na której opierają się napisy AI w VLC, opiera się na lokalnie działających modelach sztucznej inteligencji, co jest decyzją zakorzenioną w prywatności i praktyczności. W przeciwieństwie do systemów opartych na chmurze, które wymagają stałego połączenia z Internetem i wysyłają dane użytkownika na serwery zewnętrzne, modele lokalne przetwarzają informacje wyłącznie na urządzeniu użytkownika.

Ta konfiguracja nie tylko zwiększa prywatność, ale także zapewnia funkcjonalność w regionach o ograniczonym lub zawodnym dostępie do Internetu.

Lokalne modele sztucznej inteligencji, takie jak te prezentowane w tym systemie, są coraz bardziej preferowane ze względu na swoje zdolność do działania niezależnie od infrastruktury zewnętrznej. Konstrukcja ta jest szczególnie cenna w zastosowaniach wymagających szybkiego przetwarzania lub takich, w których priorytetem jest prywatność użytkownika.

Dla użytkowników oznacza to większą wydajność, mniejszą zależność od łączności internetowej i pewność, że ich dane pozostaną bezpieczne.

Dziedzictwo innowacji VLC

VLC, uruchomiony po raz pierwszy w 1996 roku jako projekt studencki w Ecole Centrale Paris, stał się jednym z najczęściej pobieranych i powszechnie używanych odtwarzaczy multimedialnych typu open source na świecie.

Początkowo projekt miał na celu umożliwienie przesyłania strumieniowego wideo na terenie kampusu uniwersyteckiego, ale przekształcił się w aplikację wieloplatformową obsługującą praktycznie wszystkie formaty multimediów. Jak zauważył Kempf: „Liczba aktywnych użytkowników VLC faktycznie rośnie, nawet w epoce usług przesyłania strumieniowego”.

Podczas ogłoszenia na targach CES firma VideoLAN świętowała przekroczenie 6 miliardów pobrań, co stanowiło kamień milowy w przypadku kilku narzędzi programowych osiągnąć trwałą popularność VLC wynika z jego prostoty, szerokiej kompatybilności i zaangażowania w bycie darmowym, wolnym od reklam i pozbawionym jakichkolwiek komercyjnych źródeł przychodów.

Wizja skupiająca się na prywatności. Przyszłość

Podejście VLC do napisów AI jest zgodne z szerszym zaangażowaniem VideoLAN w kwestie prywatności i autonomii użytkowników. Zapewniając, że całe przetwarzanie odbywa się lokalnie, organizacja w dalszym ciągu priorytetowo traktuje kontrolę swoich użytkowników nad ich własnymi danymi. Filozofia ta odegrała kluczową rolę w sukcesie VLC i pozostaje podstawowym elementem jej tożsamości w erze coraz bardziej zdominowanej przez usługi zależne od chmury.

Ogłoszenie VideoLAN na targach CES podkreśla, w jaki sposób projekty typu open source mogą pozostać konkurencyjne i istotne w szybko zmieniającym się środowisku technologicznym. W miarę ciągłego rozwoju VLC nowa funkcja napisów AI służy zarówno jako postęp technologiczny, jak i potwierdzenie jego podstawowych zasad.

Categories: IT Info