Google hat den fortschrittlichsten AI-Videogenerator VEO 3 für Entwickler veröffentlicht und heute eine kostenpflichtige Vorschau über die Gemini API und die Vertex AI gestartet. Der Umzug, der 720p-Video mit synchronisiertem Audio bei 0,75 USD pro Sekunde preisgibt, ist ein wesentlicher Schritt in der Strategie von Google, seine leistungsstarken kreativen Tools zu monetarisieren. Die API-Veröffentlichung folgt einer schnellen Reihe von Updates, die kürzlich Bild-zu-Video-Funktionen und globalen Zugriff auf Google-Abonnenten von Google mitgebracht haben. target=”_ leer”> Der neue Entwicklerzugriff ist eine kritische Erweiterung für ein Modell, das bisher in erster Linie eine mit Verbraucher gerichtete Funktion war. Die API unterstützt derzeit die Erzeugung der Text-zu-Video-Erzeugung, wobei Google verspricht, dass Bild-zu-Video-Funktionen auf dem Weg sind. Ein schnellerer, kostengünstigerer „Veo 3 Fast“-Modus ist auch für eine zukünftige API-Veröffentlichung geplant. Google Deepmind VP Eli Collins bemerkte, dass „Veo 3 aus Text und Bild ausschöpft, was zu einer realen Physik und der genauen Lippensynchronisierung auftritt.“ Diese Fähigkeit war ein wesentlicher Bestandteil der ersten Enthüllung. CEO Demis Hassabis erklärte, dass mit dieser Technologie „wir aus der stillen Ära der Videogenerierung hervorgehen. href=”https://console.cloud.google.com/freetrial/?redirectpath=/vertex-ai/studio/media/generate;tab=video”target=”_ Blank”> Rapid Prototyping in Google AI-Studios . Dies ermöglicht ein schnelles Experimentieren, bevor Sie sich zu einer umfassenden Integration verpflichten, einen entscheidenden Schritt angesichts der nutzungsbasierten Kosten. href=”https://developers.googleblog.com/en/veo-3-now-available-gemini-api/”target=”_ leer”> Brainstorming-Inhalt, schnell iterer und verbessert die Effizienz . Diese ersten Beispiele weisen auf hochspezialisierte, professionelle Workflows hin, bei denen die Kosten des Modells durch Zeiteinsparungen und kreative Beschleunigung gerechtfertigt werden können. Das Unternehmen verwendet Veo 3, um die realistischen und flüssigen menschlichen Handlungen zu erzeugen, die als grundlegende Daten für seine Pipeline dienen und KI-Ausgabe für Clients in manipulierte Charakteranimationen verwandeln. href=”https://www.youtube.com/watch?v=zki-bltwjx4″target=”_ leer”> In-Game-Video-Cutscenes die die Geschichte in seinem bevorstehenden RPG, Wit’s End vorantreiben. Dies ermöglicht es seinen Designern, schnell mit neuen narrativen Ideen und Grafiken zu experimentieren, ein wesentlicher Vorteil im iterativen Zyklus der Spieleentwicklung. Dies ist eine häufige Strategie für die Einführung leistungsstarker, aber teurer neuer Technologien, die sich zunächst auf die Nischenindustrie konzentriert, die die Kosten sofort absorbieren kann.
Die Preisstruktur unterstreicht diesen beruflichen Fokus. Nach Googles offizielle Preise kostet ein acht Sekunde 6 US-Dollar, während ein fünfminütiges Video 225 US-Dollar ausführen würde. Da das Erscheinen eines perfekten Ergebniss häufig mehrere Versuche erfordert, können die Kosten in der realen Welt schnell eskalieren. Google setzt darauf, dass dies für bestimmte Anwendungsfälle immer noch signifikant billiger ist als herkömmliche Videoproduktionsmethoden. Der Entwicklerzugriff verfolgt die globale Veröffentlichung des Modells Anfang Juli an AI Pro-Abonnenten und die Hinzufügung von Image-zu-Video-Funktionen erst letzte Woche. Diese Struktur schafft eine klare Unterscheidung zwischen dem Mainstream $ 19,99/Monat AI Pro-Plan, der auf allgemeine kreative Exploration abzielt, und dem High-End-AI-Ultra-Plan von 249,99 USD pro Monat. Die API bietet nun einen dritten, eindeutigen Weg, um auf die Technologie zuzugreifen, die sich eher auf die kommerzielle Integration als auf den individuellen Gebrauch richtet. Durch die Aufnahme eines Preisschilds für das fortschrittlichste Videomodell macht Google eine klare Aussage zu seinen kommerziellen Ambitionen im Generativ-KI-Markt. Dies ist ein zentraler Bestandteil des erklärten Engagements von Google für die verantwortungsvolle KI-Entwicklung und die Bereitstellung von Transparenz für die Medien von AI-generierten. Die Technologie ist jedoch keine Silberkugel, da akademische Studien haben festgestellt, dass die Wasserzeichen nicht narrensicher sind. Als Filmemacher Darren Aronofsky