Google wypuściło Veo 3.1, znaczącą aktualizację swojego modelu generowania wideo AI, która zwiększa kontrolę nad kreacją i realizm dla twórców. Nowa wersja narzędzia Google do tworzenia filmów AI, Flow, wprowadza bardziej szczegółowe możliwości edycji.
Użytkownicy mogą teraz dodawać obiekty do sceny i korzystać z bogatszego, zsynchronizowanego dźwięku we wszystkich zaawansowanych funkcjach Flow. Aktualizacja, która poprawia również szybkość stosowania i jakość wizualną, jest udostępniana w edytorze Flow, aplikacji Gemini oraz za pośrednictwem Gemini API dla programistów.
To posunięcie sygnalizuje zamiar Google, aby uczynić swoje narzędzia generatywne bardziej wydajnymi i intuicyjnymi. Od majowego uruchomienia Flow użytkownicy stworzyli ponad 275 milionów filmów, co wskazuje na duże zapotrzebowanie na dostępne filmy oparte na sztucznej inteligencji. Wydanie jest postrzegane jako bezpośredni ruch konkurencyjny w stosunku do Sora 2 OpenAI.
W toku pojawia się bardziej szczegółowa kontrola kreatywna
W swoim ogłoszeniu Google określiło aktualizację jako bezpośrednią odpowiedź na opinie twórców dotyczące bardziej wyrafinowanych narzędzi postgeneracyjnych.
Według liderów produktów Jess Gallegos i Thomasa Iljica „zawsze słuchamy Waszych opinii i słyszeliśmy że potrzebujesz większej kontroli artystycznej we Flow, ze zwiększoną obsługą dźwięku we wszystkich funkcjach.”
Skoncentrowanie się na iteracji kierowanej przez użytkownika oznacza strategiczną zmianę, przenosząc Flow z silnika czystej generacji do bardziej wszechstronnego i interaktywnego pakietu kreatywnego.
Głównym elementem tego wysiłku jest zestaw nowych narzędzi do edycji w edytorze Flow, zaprojektowanych z myślą o chwilach, w których pierwsze ujęcie nie jest ostateczne.
[treść osadzona]
Najbardziej godnym uwagi dodatkiem jest funkcja „Wstaw”, która umożliwia twórcom dodawanie nowych elementów — od subtelnych, realistycznych szczegółów po całkowicie fantastyczne stworzenia — do już wygenerowanego klipu wideo.
Zaprojektowano ją tak, aby zapewnić użytkownikom możliwość ponownego wyobrażenia sobie i udoskonalenia scen bezpośrednio w aplikacji, redukując potrzebę stosowania zewnętrznego oprogramowania do edycji w przypadku drobnych poprawek i uzupełnień.
Według Google Wyrafinowanie modelu sprawia, że te dodatki wyglądają naturalnie i odpowiednio do kontekstu. Veo 3.1 inteligentnie analizuje istniejącą scenę, aby uwzględnić złożone szczegóły, takie jak cienie i oświetlenie otoczenia, zapewniając osadzenie nowego obiektu w środowisku.
Co więcej, model stara się wtopić wstawiony element w ustalony styl artystyczny klipu. Ta funkcja wykracza poza proste umieszczanie obiektów, oferując bardziej dynamiczny i spójny sposób udoskonalania treści generowanych przez sztuczną inteligencję.
W uzupełnieniu tej nowej funkcji firma Google ogłosiła również, że odpowiednia funkcja „Usuń” „wkrótce” pojawi się w edytorze Flow.
Umożliwi ona użytkownikom płynne usuwanie niechcianych obiektów lub postaci ze sceny. Firma wyjaśniła, że Flow automatycznie zrekonstruuje tło i otoczenie, sprawiając wrażenie, jakby obiektu w ogóle tam nie było.
W sumie te funkcje stanowią znaczący krok w kierunku zapewnienia kompletnego zestawu narzędzi do malowania i malowania wideo AI.
Od cichych klipów po bogate opowiadanie historii audio
W wersji Veo 3.1 głównym celem jest rozszerzenie dźwięku możliwości. Opierając się na Veo 3, który był pierwszym modelem Google integrującym dźwięk, aktualizacja wprowadza teraz generowanie dźwięku do najbardziej zaawansowanych funkcji kreatywnych Flow.
To ulepszenie rozwiązuje kluczowe ograniczenie wcześniejszych narzędzi wideo AI. Jak wcześniej oświadczył dyrektor generalny Google DeepMind, Demis Hassabis, „wychodzimy z cichej ery generowania wideo”. Ta aktualizacja stanowi znaczący krok w realizacji tej wizji, dodając dialogi, efekty dźwiękowe i hałas otoczenia.
Nacisk na realizm ma kluczowe znaczenie dla tworzenia wiarygodnych i wciągających treści bez czasochłonnych prac postprodukcyjnych.
Twórcy mogą teraz generować bogaty, zsynchronizowany dźwięk, korzystając z funkcji takich jak „Składniki do wideo”, które wykorzystują obrazy referencyjne do kontrolowania postaci i stylu. Narzędzie „Klatki do wideo” służące do tworzenia przejść między dwoma obrazami obejmuje teraz także dźwięk.
[zawartość osadzona]
Funkcja „Rozszerzaj”, używana do tworzenia dłuższych, ciągłych ujęć, będzie teraz generować także towarzyszące krajobrazy dźwiękowe, dzięki czemu będzie bardziej przydatna do tworzenia ujęć i dłuższych sekwencji narracyjnych.
Strategiczne wprowadzenie w wyścigu wideo AI
Google wdraża Veo 3.1 w całym pakiecie produktów AI, aby zmaksymalizować swój zasięg. Oprócz edytora Flow przeznaczonego dla konsumentów i aplikacji Gemini model jest teraz dostępny dla programistów i klientów korporacyjnych.
Programiści mogą uzyskać dostęp do Veo 3.1 i jego nowych funkcji poprzez płatną wersję zapoznawczą w interfejsie API Gemini, co umożliwia im integrację potężne możliwości generowania wideo do własnych aplikacji. Klienci korporacyjni mogą wykorzystać ten model za pośrednictwem Vertex AI.
Ta wielotorowa strategia dystrybucji pokazuje ambicję Google do konkurowania w szybko rozwijającej się dziedzinie sztucznej inteligencji wideo. Wydanie następuje wkrótce po kontrowersyjnej premierze aplikacji Sora 2 firmy OpenAI, która spotkała się z natychmiastową reakcją na obawy dotyczące praw autorskich i deepfake.
Z drugiej strony Google w dalszym ciągu podkreśla swoje zaangażowanie w odpowiedzialną sztuczną inteligencję, osadzając swój znak wodny SynthID we wszystkich generowanych treściach. Wydaje się, że strategia ta została skalkulowana, aby pozycjonować Veo jako bardziej stabilną i gotową do zastosowania w przedsiębiorstwach alternatywę.
Aktualizacja wzmacnia również wyjaśnioną dwupoziomową strategię Google w zakresie subskrypcji, dodając wymierną wartość do planów AI Pro i AI Ultra, aby zachęcić do adopcji i zbudować lojalną bazę użytkowników.
Kształtowanie przyszłości tworzenia filmów AI
Szybka ewolucja Oczekuje się, że generatywnych narzędzi wideo odmieni branże kreatywne. Wprowadzenie precyzyjnych elementów sterujących edycją i zintegrowanego dźwięku w Veo 3.1 obniża barierę techniczną dla produkcji wideo wysokiej jakości, umożliwiając scenarzystom szybsze wprowadzanie pomysłów.
W miarę dojrzewania tych platform stają się one mniej nowością, a bardziej integralną częścią twórczego przepływu pracy, od tworzenia scenorysów po końcową produkcję. Nacisk przesuwa się z prostego tekstu na wideo na bardziej interaktywny proces oparty na współpracy między twórcą-człowiekiem a modelem sztucznej inteligencji.