Google osadza swoje AI GEMINI GŁĘBIEJ w przestrzeń roboczą Google, nagłówka znaczącej aktualizacji do Google Meet, które wprowadza tłumaczenie mowy w czasie rzeczywistym zaprojektowane w celu zachowania autentycznych właściwości głośnika. Ogłoszona na konferencji Google I/O 2025 w dniu 20 maja 2025 r. Ta funkcja początkowo obsługuje angielski i hiszpański, mając na celu sprawienie, aby wielojęzyczne wirtualne rozmowy wydawały się bardziej naturalne i włączające. Firma wyszczególniła, że tłumaczenie zasilane przez AI zacznie się w tym tygodniu wdrażać w wersji beta dla Google AI Pro i Ultra Subskrybentów.
To ulepszenie jest częścią szerszego zestawu aktualizacji zasilanych przez Gemini w całym obszarze roboczym. Użytkownicy Gmaila mogą przewidzieć spersonalizowane inteligentne odpowiedzi jeszcze w tym roku; Ta funkcja przeanalizuje kontekst i ton wcześniejszych wiadomości e-mail i napędu pliki, aby wygenerować odpowiedzi, które autentycznie odzwierciedlają typowy styl komunikacji użytkownika. Ponadto Google Vids, wspomagane AI narzędzie do tworzenia wideo, jest teraz ogólnie dostępne dla subskrybentów Google AI Pro i nowego planu ultra. Dla użytkowników zmiany te sygnalizują przejście w kierunku bardziej intuicyjnych, inteligentnych narzędzi zdolnych do obsługi złożonych zadań komunikacyjnych, ostatecznie wspierając lepszą wydajność i współpracę. Google opisał swoją nową technologię tłumaczenia jako „bardzo, bardzo blisko”, aby umożliwić naturalną i swobodną rozmowę.
zrewolucjonizowanie współpracy między językiem
Nowe tłumaczenie na żywo w Google spotyka się poza podstawowe podpisy tekstowe, co było poprzednią metodą translacji w internowaniu. Kluczowa innowacja polega na zdolności sztucznej inteligencji do dopasowania tonu, kadencji, a nawet wyrażeń głośnika, a tym samym skuteczniej przekazując zamiar. Dr Evelyn Reed, ekspert ds. Technologii komunikacji, Powiedział że„ to nie chodzi tylko o słowa; chodzi o przekazanie intencji. Google koncentracja Google na Vocal Nuance może być revolutionary dla zespołu rozpowszechnionego. “. src=”https://winbuzzer.com/wp-content/uploads/2025/05/google-gemini-live-sPeech-ranslation-fopicial.jpg”>
Aby to osiągnąć, Google wyszkolił swoje modele AI na rozległych zestawach wielojęzycznych, nabrzeżne, stały się podsumowując. Google twierdzą, że skupili się na minimalizacji opóźnienia, aby zapewnić, że rozmowy przepływają tak naturalnie, jak to możliwe, nawet przy złożonych tłumaczeniach w tle, podkreślając wysiłki w celu utrzymania przepływu konwersacyjnego.
[Wbudowana treść]
Podczas gdy obecnie w beta dla subskrybentów premium, Google planuje „wczesne testowanie” dla użytkowników przedsiębiorstw w późniejszym okresie 2025 r. Rozwiązanie konferencyjne, które ma na celu stworzenie „głęboko wciągającego wrażenia konwersacyjnego”.
Race zbrojeń AI na platformach komunikacyjnych
Najnowsze ulepszenia Google pojawiają się, ponieważ konkurencja intensyfikuje się między gigantami technologicznymi w celu zintegrowania wyrafinowanych AI z platformami komunikacyjnymi. Na przykład Microsoft aktywnie rozwija podobne możliwości dla swojej platformy zespołów. Jego funkcja „Interpreter in Teams”, ogłoszona pod koniec 2024 roku, ma na celu oferowanie tłumaczenia w czasie rzeczywistym, które mogą symulować głos mówcy, aby uzyskać bardziej osobiste doświadczenie. Microsoft uruchomił również Translator Pro, aplikację mobilną do tłumaczenia mowy o klasy korporacyjnej, i rozszerza na żywo angielskie tłumaczenia napisów na szerszą gamę Copilot+ PC. Wykorzystując słynną jakość tłumaczenia i bezpieczeństwo mowy w czasie rzeczywistym, początkowo priorytetem jest wyniki tekstowe dla podpisów, aby zapewnić minimalne opóźnienia i rozwiązać bezpośrednie wyzwania biznesowe.
Te równoległe osiągnięcia podkreślają znaczący trend w branży w zakresie wykorzystania AI do zaburzenia barier językowych, choć strategie dotyczące zachowania głosu i produkcji. W przypadku systemów wysokiej klasy, takich jak Google Beam, powszechne przyjęcie i uzasadnienie kosztów będzie testem krytycznym.
Trwająca integracja AI Google w przestrzeni roboczej
Wprowadzenie tłumaczenia mowy na żywo z niuansem wokalnym jest najnowszą strategią Google w zakresie ciągłej strategii Google w celu wprowadzenia jego narzędzi Workspace z AI. Wcześniej, w sierpniu 2024 r., Google Meet wprowadziło funkcję notatek z zasilaniem AI o nazwie „Rób notatki dla mnie” dla niektórych użytkowników przestrzeni roboczej. Było to częścią spotkań AI i dodatku do przesyłania wiadomości, które obejmowało również narzędzie do automatycznego transportu, reprezentujące wcześniejszą iterację pomocy w tłumaczeniu.
Funkcje te znajdują się pod parasolem Duet AI Suite Google, które obejmuje również funkcje takie jak anulowanie szumów i wzmocnienie wideo. Chociaż te narzędzia AI oferują znaczące korzyści, dokładność treści generowanych przez AI pozostaje obszarem ciągłego rozwoju i uwagi użytkownika. Dalsze szczegółowe informacje na temat wszystkich najnowszych funkcji Gemini w Google Workspace są dostępne na oficjalnym