A Google kibővíti mesterséges intelligencia eszközkészletét az üzleti ügyfelek számára, és jelentős frissítéseket mutat be a médiagenerációs modelljeinek Cloud Konferencia április 9-én, 2025 , elsősorban megcélozva. A gyors nyomon követés bemutatásakor a vállalat Veo 2 videogenerációs modellje április 11-én kezdte meg a kiválasztott felhasználók számára, a Google ai studio platform a Gemini API-n keresztül. A kezdeti bevezetés néhány amerikai székhelyű felhasználó számára gyakorlati tapasztalatokat nyújt a Veo 2-rel. A korai hozzáférés korlátozottnak tűnik, és az Egyesült Államokon kívüli felhasználóknak szükség lehet olyan műszaki megoldásokra, mint a VPNS, hogy még az opciót is megtekintsék. A korai tesztelők által bejelentett és a Google Fejlesztői Blogjában megerősített jelenlegi képességek 720p felbontással és 24 képkocka másodpercre állítják be, maximális videó időtartamával 8 másodperc. Ez a kezdeti telepítés a következő bejelentést követi, ahol a Google részletes új Veo 2 funkciók, amelyek megtekintik a csúcsot, beleértve a továbbfejlesztést szerkesztés mint például a háttér eltávolítása vagy az idő lefoglalása. A Vertex AI-nál lévő szolgáltatás-előnézet és az AI stúdió modell bevezetése közötti elválasztás a vállalati fejlesztők eltérő hozzáférési útvonalait javasolja, szemben az egyes alkotókkal vagy tesztelőkkel. AI Music Generation
A videó mellett a Google bemutatta a Lyria-t, annak szöveg-zenei AI-modelljét most privát előnézetben a Vertex AI-n a jóváhagyott ügyfelek számára. href=”https://docs.google.com/forms/d/1yktciiizyze6txfknq9pzybglzoeh0ljmunhjubi1m/viewform?edit_requested=True”Target=”_ blank”> Alllistlist kérési forma
. A Google azt sugallja, hogy a Lyria teljes zenei darabokat készíthet a szöveges utasításokból származó különféle műfajok között, potenciálisan segítve a vállalkozásokat a marketing kampányok vagy magával ragadó élmények egyedi hangjának létrehozásában, potenciálisan csökkentve a hagyományos stock zenei könyvtárakra való támaszkodást és a kapcsolódó licencek komplexitásait. Chirp 3, a Google audiogenerációs és megértő modellje, amely általában elérhetővé válik a Vertex AI-n. Egy korábbi előnézeti szakasz után, amelyet 2025 márciusában jelentettek, a Chirp 3 hivatalosan tartalmaz egy „azonnali egyedi hang” funkciót, amely szerint a Google állítása szerint mindössze 10 másodperces hangot klónozhat. Több hangszóró beállítása és egy meghatározott ellenőrzési folyamat alapján működik, hogy ellenőrizze a megfelelő felhasználási engedélyeket. A Chirp 3 bemutatja egy olyan transzkripciós eszközt is, amelynek célja a felvételek különböző hangszóróinak megkülönböztetése. Az Imagen 3, amelyben a Vertex AI korábbi előnézeti bevezetése volt, további fejlesztéseket kapott a Cloud Next-en. Ezek a fejlesztések a hiányzó képalkatrészek jobb rekonstrukciójára (lepattanás) és a jobb minőségű objektum eltávolítására összpontosítanak, amelyek realisztikusabb és részletesebb képmenetre irányulnak a korábbi verziókhoz képest. A Google hivatalos blogja kiemelte a Vertex AI-t, mint egyedülállóan generatív modelleket, amelyek videót, képet, beszédet és zenét ölelnek fel. Ez a stratégia a Google-t közvetlen versenybe helyezi más Cloud AI platformokkal, például az Amazon alapkőzetével. A Cloud Next Event szélesebb körű AI bejelentéseket is látott, beleértve az új, egyedi szilíciumot, mint például az Ironwood TPU-t és a kereteket, mint például az Agent Development Kit (ADK), jelezve a Google Cloud ügyfeleinek széles körű AI-fókuszt. A Google kijelentette, hogy az újabb modelljei által generált média, mint például az Imagen, a Veo és a Lyria, szintetikus vízjeleket tartalmaz. A vállalat emellett beépített biztosítékokra is hivatkozott a káros tartalom létrehozása és a hangklónozó eszköz speciális ellenőrzési folyamatára. Ez továbbra is egy érzékeny téma iparági szintű, folyamatban van a