A
A Google ma új kép-videó képességgel javította a Veo 3 AI modelljét, lehetővé téve a felhasználók számára, hogy egyetlen fényképet egy nyolc másodperces videoklipré alakítsanak. A szolgáltatás a Gemini alkalmazáson keresztül a cég AI Pro és AI Ultra tervek előfizetői számára bevezeti. Ez a frissítés akkor érkezik, amikor a Google a Veo 3 számára lenyűgöző korai örökbefogadásról számol be, a felhasználók pedig mindössze hét hét alatt több mint 40 millió videót készítenek. A múlt héten követi a Veo 3 szöveg-video-funkciójának globális bevezetését, megszilárdítva azt a lökést, hogy a fejlett generatív AI eszközök napi erőforrássá váljanak. Kép
A Core Technology, a VEO 3, jelentős technikai ugrást jelent. A szinkronizált audio létrehozásának képessége, beleértve a párbeszédet és a környezeti hatásokat, kulcsfontosságú megkülönböztető. A Google Deepmind vezérigazgatója, Demis Hassabis kijelentette, hogy ezzel a modellel: „A videó generáció csendes korszakából származunk.”
Ez egy jelentős akadályt jelent az AI által generált videó számára, hogy teljes mértékben a dobozból érezze magát. Eli Collins, a Google Deepmind VP, kiemelte a modell kifinomultságát, megjegyezve, hogy „a Veo 3 a szövegből és a képből kiemelkedik a valós fizikába és a pontos ajak szinkronizálására”. A fizikára és az ajak-szinkronizálásra való összpontosítás elengedhetetlen a hiteles tartalom szempontjából. A Gemini alkalmazásban a felhasználók kiválasztják a „Video” lehetőséget, töltsön fel egy fényképet, majd adjon szöveges utasításokat a kívánt animációhoz és a kísérő audio effektusokhoz. A Flow Integrálja a VEO-t a videóhoz, az Imagenhez képalapokhoz és a Gemini számára a természetes nyelv felszólításához, létrehozva egy átfogó csomagot a fejlett kreatív projektekhez. Ez a generációs folyamat nem tárgyalható része minden felhasználó számára. A társaság célja az átláthatóság biztosítása és annak biztosítása, hogy az AI által generált tartalom egyértelműen azonosítható legyen, egy kritikus lépés, mivel ezek az eszközök erősebbé válnak.
A megoldás azonban nem bolond. A Marylandi Egyetemen egy független tanulmány megállapította, hogy a vízjelek kiszolgáltatottak lehetnek a manipulációval szemben. A kutatók arra a következtetésre jutottak, hogy „a vízjelek értéket kínálnak az átláthatósági erőfeszítésekben, de nem nyújtanak abszolút biztonságot az AI által generált tartalom manipulációja ellen”, kiemelve a folyamatban lévő technológiai fegyverversenyt a generáció és a kimutatás között. Előfizetési stratégia
Ez a szolgáltatás bevezetése aláhúzza a Google felújított AI bevételszerzési stratégiáját, amelyet májusban tisztázott azáltal, hogy zavaró márkaneveket vonult vissza, mint például a „Gemini Advanced” és az „AI Premium”. A nagyjavítást úgy tervezték, hogy megszüntesse a régóta fennálló márka zavarát és egyértelműbb érték-javaslatot hozzon létre. Ez a felhasználók számára 2 TB tárolást, a Gemini 2.5 Pro modellt és 1000 havi AI-kreditet biztosít, amely a Google szerint „bőséges helyet kínál a kreatív felfedezéshez”. 30 TB tárolót, YouTube prémium előfizetést és egy hatalmas, 12 500 havi kredit intenzív felhasználás céljából. Ez igazolható a kísérleti eszközökhöz való korai hozzáféréssel, mint például a Project Mariner AI Agent. A három ingyenes Daily Veo 3 generációra való áttérés egy korlátozott egyszeri próbaverziót váltott ki, és a tervet tartós kreatív erőforrássá változtatta, nem pedig egy egyszerű demonstrációvá.