A
A Google kibővítette az AI-hajtású videogenerátort, a Veo 2-t a Gemini Advanced felhasználókra, lehetővé téve a szöveges videó létrehozását közvetlenül a platform webes és mobil interfészeiből. A 19,99 dolláros AI prémium terv előfizetői most már a VEO 2-et használhatják 8 másodperces, 720p videoklipek előállításához írásbeli utasítások alapján. A lépés a vállalati szintű kísérletektől a fogyasztókkal néző kreativitásra való áttérést jelzi, megkönnyítve a nem szakemberek számára az AI video produkciós eszközökkel való kapcsolatfelvételt. Ez a Google Labs-on keresztül elérhető eszköz a kép-video munkafolyamatokat nyitja meg a hobbisták és a vizuális tervezők számára egyaránt. Ezt megelőzően a fejlesztők és a vállalati csapatok a VEO 2-t a Vertex AI-n keresztül használták, ahol a költségek 0,50 dollár/másodperc a rendezett tartalom. A Gemini Advanced bevezetése a következő 2025-ös bejelentést követi április 9-én, és a Developer Access április 11-én, egy multi-szintű indítási stratégiát fejez be. Realizmus
Ellentétben az egyszerűbb, a Video-to-Video eszközökkel, a Veo 2 lehetővé teszi a felhasználók számára, hogy befolyásolják a filmművészeti jellemzőket. Az olyan utasításokat, mint például a „Sekély mélységélességű tárgy nyomon követése” vagy a „Használjon széles látószögű lencsét”, megértik és tükrözik a végső kimenetben. A Google kijelenti, hogy a modellt a „operatőr nyelve” képzették, lehetővé téve a lövés-specifikus stílusvezérlést, amelyet általában nem láttak a fogyasztói AI video platformokon. Ezek a korai demókban szereplő példák bebizonyították a Veo 2 képességét, hogy megismételjék a világítási viselkedést, a természetes mozgást és a textúra hűségét-olyanok, amelyek kihívást jelentenek a leginkább generatív videórendszerekre. Míg a Gemini a Google szerint a Google szerint a Google szerint a Google szerint a Google szerint a Google szerint a belső tesztelés azt mutatta, hogy „a felhasználók 59%-a a Veo 2 kimeneteit részesíti előnyben a Sora Turbo termeléseivel szemben”, az Openai video modellje, amely 1080p és 20 másodpercenként, klipen/20 másodpercenként részesül. Ez lehetővé teszi a VEO versenyképességét a vizuális minőségben, bár a hozzáférési szintű korlátozások továbbra is korlátozzák a teljes teljesítményt a nem vállalkozói felhasználók számára. A rövidnadrág-alkotók a természetes nyelvet használhatják a vizuális stílusok alkalmazására az AI által generált klipekre.
Ezek az eszközök ugyanazon a VEO 2 infrastruktúrára támaszkodnak, de különböző felhasználói felületrétegekkel és hozzáférési modellekkel. A Gemini Advanced csomagolt hozzáférést kínál, míg a YouTube és a laboratóriumok tükrözik a Google stratégiáját, hogy a generatív AI-t beágyazzák a meglévő kreatív ökoszisztémákba. A Gemini-felhasználók fizetnek egy havi előfizetést, és korlátozott számú generációt kapnak, a Google megjegyezve, hogy a felhasználókat „értesítik, amikor megközelítik a havi generációs limitet” A hivatalos blog szerint. Ezzel szemben a Vertex AI-n történő felhasználás percenként több száz dollárba kerülhet, a felbontástól és a klip hosszától függően. Az AI Studio, amelynek ára 0,35 dollár/másodperc között volt, április elején hídként szolgált a fejlesztők számára. Azok a funkciók, mint az idő-lapos, a multi-lövés szekvenálás és a háttérszerkesztési eszközök, kizárólag a Vertex Ai-termékek számára, a Google-termékek számára, a Google-termékek számára, a Google-termékek. Video munkafolyamatok. Ezek a korlátozások szándékosan megszakított bevezetést jeleznek-a hozzáférés és a teljesítmény megtévesztése a szerver túlterhelésének és a minőség lebomlásának megakadályozása érdekében. Ez a láthatatlan aláírás lehetővé teszi a tartalom ellenőrzését anélkül, hogy befolyásolná a minőséget. A rendszer igazodik a C2PA szabványokhoz, és alátámasztja a Google felelősségteljes AI telepítésre vonatkozó állításait. Az önmagában azonban a szintid önmagában nem tudja érvényesíteni a használati politikákat, hacsak a harmadik fél platformjainak támogatása támogatja az észlelést és a végrehajtást-valami továbbra is következetes a szolgáltatások között. Míg a YouTube-on alkotói kiléphetnek a harmadik féltől származó modellképzésből, a társaság megőrzi a közönség tartalmának a saját AI-jének felhasználásának jogát. A YouTube-politika kimondja, hogy „a alkotói tartalom jogosulatlan módon való hozzáférése, például az illetéktelen kaparás, továbbra is tiltott”, ám a kritikusok megjegyzik, hogy ez nem foglalkozik teljes mértékben a akaratlan modell hozzájárulásával kapcsolatos aggodalmakkal. Addig a spekuláció folytatódik a YouTube-adatok szerepéről a Veo képességeinek kiépítésében. Például, a modellt arra használták, hogy elősegítsék az OZ varázslójának javítását a magával ragadó LED-es kupola számára a las vegas”> las vegas”> las vegas”> las vega Felvétel Ai-kiterjesztett háttérrel. Ez az alkalmazás kiemeli a VEO potenciálját, hogy támogassa a digitális helyreállítást és a skálázható tartalom-kiegészítést a szakmai beállításokban. Ezeket a modelleket egyre inkább integrálják a Vertex AI és a Google Labs-ba, hogy támogassák a média-tartalom létrehozását. A DeepMind vezérigazgatója, Demis Hassabis nemrégiben kijelentette, hogy „a Google végül ötvözi a Gemini és a Veo AI modelleket a fizikai világ megértése érdekében”-ez egy olyan lépés, amely előkészítheti az utat az egységes, multimodális AI alkalmazásokhoz. Jelenleg a Veo 2 Gemini-be érkezett érkezése egy azonnali ambíciót jelez: olyan eszközt adni, amely olyan eszközt ad, amely animálhatja az ötleteket, anélkül, hogy kamerákra, legénységre vagy drága szerkesztési szoftverre lenne szükség. Még mindig korlátozott-felbontás, időtartam és hozzáférési szintek-, de ez a legtisztább példa a Google szándékára, hogy generatív videót hozzon a mindennapi kreatív munkafolyamatokba.