Microsoft ogłosił dzisiaj na konferencji Build 2024 nową funkcję dla swojej przeglądarki Edge, która będzie tłumaczyć i kopiować filmy w czasie rzeczywistym. Ta funkcja będzie dostępna na popularnych platformach, takich jak YouTube, LinkedIn i Coursera. Ogłoszenie zostało ogłoszone podczas tegorocznej imprezy Build i podkreślało integrację sztucznej inteligencji w celu poprawy komfortu użytkownika.
Obsługiwane języki i dostępność
Początkowo funkcja ta będzie dostępna obsługuje tłumaczenia z hiszpańskiego na angielski i z angielskiego na niemiecki, hindi, włoski, rosyjski i hiszpański. To rozwiązanie jest przeznaczone nie tylko dla użytkowników, którzy wolą korzystać z treści w swoim ojczystym języku, ale ma także na celu uczynienie filmów wideo bardziej dostępnymi dla osób niesłyszących lub niedosłyszących. Tłumaczenie w czasie rzeczywistym będzie dostępne zarówno z dubbingiem, jak i napisami.
Rozszerzenie o witryny z wiadomościami
Oprócz platform edukacyjnych i mediów społecznościowych Edge będzie rozszerzyć tę funkcjonalność na serwisy informacyjne, w tym Reuters, CNBC i Bloomberg. Firma Microsoft poinformowała, że z czasem planuje rozszerzyć zakres obsługiwanych języków i witryn internetowych, dzięki czemu ta funkcja będzie bardziej wszechstronna i będzie miała szersze zastosowanie.
[treść osadzona]
Ta nowa funkcja tłumaczenia opiera się na istniejącym zestawie możliwości sztucznej inteligencji przeglądarki Microsoft Edge, który obejmuje integrację z Copilot. Edge oferuje już możliwość podsumowywania filmów z YouTube, chociaż do generowania tych podsumowań wykorzystuje dostępność transkrypcji wideo. Ta nowa funkcja stanowi znaczące ulepszenie zestawu narzędzi sztucznej inteligencji przeglądarki.
Kontekst historyczny tłumaczenia sztucznej inteligencji w produktach firmy Microsoft
Microsoft ma doświadczenie we wdrażaniu sztucznej inteligencji tłumaczenie na swoje produkty. Od 2018 r. w aplikacji Microsoft Teams dostępne jest wbudowane tłumaczenie wiadomości, a w 2022 r. wprowadzono tłumaczenie na żywo napisów dla subskrybentów usługi Teams Premium. Przeglądarka Edge obsługuje tłumaczenie stron internetowych i wybranego tekstu od 2020 r. Ponadto aktualizacja systemu Windows 11 2022 wprowadziła napisy generowane przez sztuczną inteligencję do przesyłanych strumieniowo i nagranych wcześniej filmów, chociaż bez możliwości tłumaczenia.
Dubbing, która polega na zastąpieniu dźwięku mówionego głosem generowanym przez sztuczną inteligencję w ojczystym języku użytkownika, to nowy dodatek do pakietu funkcji firmy Microsoft. Proces ten może wymagać dużych zasobów. Na przykład usługi takie jak synthesys.io oferują ograniczoną generację audio/wideo za 20 USD miesięcznie, podczas gdy ElevenLabs.io zapewnia bezpłatne usługi tłumaczeniowe z pewnymi ograniczeniami. Wskazuje to na potencjalny koszt i złożoność wdrożenia takiej funkcji.
Automatyczne tłumaczenie stron internetowych jest już dobrze ocenianą funkcją w przeglądarkach internetowych. Dodanie tłumaczonych lub dubbingowanych treści wideo w czasie rzeczywistym mogłoby wyróżnić Edge na tle konkurencji, potencjalnie przyciągając więcej użytkowników do przeglądarki. Ta nowa funkcja podkreśla zaangażowanie Microsoftu w wykorzystanie sztucznej inteligencji w celu poprawy dostępności i komfortu użytkowania wszystkich swoich produktów.