A
A Google mélyebben beágyazza a Gemini AI-t a Google munkaterületébe, amelyet a Google-hoz való találkozás jelentős frissítése vezet, amely valós idejű beszédfordítást vezet be, amelynek célja a hangszóró hiteles vokális tulajdonságainak megőrzése. A Google I/O 2025 2025. május 20-i konferenciáján bejelentett szolgáltatás kezdetben az angol és a spanyol nyelvtámogatást támogatja, amelynek célja, hogy a többnyelvű virtuális beszélgetések természetesebb és befogadóbb érezzék magukat. A társaság részletezte, hogy az AI-alapú fordítás ezen a héten elindul a BETA-ban a Google AI Pro és az Ultra előfizetők számára. A Gmail-felhasználók idén később számíthatnak személyre szabott intelligens válaszokra; Ez a szolgáltatás elemzi a múlt e-mailek kontextusát és hangját, és meghajtja a fájlokat, hogy olyan válaszokat generáljon, amelyek hitelesen tükrözik a felhasználó tipikus kommunikációs stílusát. Ezenkívül a Google Vids, az AI-asszisztált videó létrehozási eszköz általában elérhető a Google AI Pro előfizetői és az új Ultra terv számára. A felhasználók számára ezek a fejlemények azt jelzik, hogy az intuitívabb, intelligensebb eszközök felé haladnak, amelyek képesek összetett kommunikációs feladatokat kezelni, végül elősegítve a jobb termelékenységet és együttműködést. A Google az új fordítási technológiáját úgy jellemezte, mint „nagyon, nagyon közel” a természetes és szabadon folyó beszélgetés lehetővé tételéhez. A legfontosabb innováció abban rejlik, hogy az AI azon képessége, hogy megfeleljen a hangszóró hangjának, ütemének és akár kifejezéseinek, ezáltal hatékonyabban közvetítve a szándékot. Dr. Evelyn Reed, a kommunikációs technológiai szakértő, azt mondta: „Ez a„ Ez a forgalmazás nem csak a szavakról szól; src=”https://winbuzzer.com/wp-content/uploads/2025/05/google-gemini-live-speech-translation-ficial.jpg”>
Ennek elérése érdekében a Google a Google képzte az AI modelleket kiterjedt többnyelvű beszédadat-adatgyűjteményeken, beépítő diver akcentusokat és beszélő stílusokat. A Google azt mondja, hogy nagymértékben a késleltetés minimalizálására összpontosítottak annak biztosítása érdekében, hogy a beszélgetések a lehető leghátúabban folyjanak, még a háttérben is összetett fordításokkal is, hangsúlyozva a beszélgetési folyamat fenntartásának erőfeszítéseit. Konferencia megoldás, amelynek célja a „mélyen magával ragadó beszélgetési élmény” létrehozása. Például a Microsoft aktívan fejleszti hasonló képességeit a Teams platformja számára. A „Teamok tolmácsának” funkciója, amelyet 2024 végén jelentettek be, úgy tervezték, hogy valós idejű beszéd-beszéd-fordítást kínáljon, amely szimulálhatja a hangszóró hangját a személyesebb élmény érdekében. A Microsoft elindította a Translator Pro-t is, egy mobil alkalmazást az vállalati szintű beszédfordításokhoz, és az élő angol felirat-fordításokat bővítette a Copilot+ PC-k szélesebb sorozatán keresztül. A híres fordítási minőség és biztonság a valós idejű beszédhez, kezdetben a szövegalapú output prioritása a feliratok számára, hogy biztosítsák a minimális késleltetést és megoldják az azonnali üzleti kihívásokat. A csúcskategóriás rendszerekhez, mint például a Google Beam, a széles körben elterjedt elfogadás és a költség-indoklás kritikus teszt lesz. Korábban, 2024 augusztusában, a Google Meet egy AI-alapú jegyzetkészítő funkciót készített, melynek neve „Take Notes for Me”, bizonyos munkaterület-felhasználók számára. Ez egy AI találkozók és üzenetküldő kiegészítő részét képezte, amely beépített egy automatikus transzlációs eszközt, amely a fordítási segítség korábbi iterációját képviseli. Noha ezek az AI-eszközök jelentős előnyökkel járnak, az AI által generált tartalom pontossága továbbra is a folyamatban lévő fejlődés és a felhasználói figyelem területe. További részletek a Google Workspace összes legutóbbi Gemini-funkciójáról elérhetőek a hivatalos munkanap blog .
.
.
.