Η Google έχει επεκτείνει τη γεννήτρια βίντεο που λειτουργεί με AI VEO 2 στους χρήστες Gemini Advanced, επιτρέποντας τη δημιουργία βίντεο που βασίζεται σε κείμενο απευθείας από τις διεπαφές ιστού και κινητής τηλεφωνίας της πλατφόρμας. Οι συνδρομητές στο σχέδιο Premium $ 19.99/μήνα μπορούν τώρα να χρησιμοποιήσουν το VEO 2 για να δημιουργήσουν κλιπ βίντεο 8 δευτερολέπτων, 720p με βάση γραπτές προτροπές. Η κίνηση σηματοδοτεί μια μετατόπιση από τον πειραματισμό σε επίπεδο επιχείρησης σε δημιουργικότητα που βλέπει τους καταναλωτές, καθιστώντας ευκολότερη τη συμμετοχή των μη εξειδικευμένων εργαλείων παραγωγής AI. Αυτό το εργαλείο, το οποίο είναι προσβάσιμο μέσω των εργαστηρίων Google, ανοίγει τις ροές εργασίας για τους χομπίστες και τους οπτικούς σχεδιαστές. Πριν από αυτό, οι προγραμματιστές και οι επιχειρηματικές ομάδες χρησιμοποίησαν το VEO 2 μέσω του Vertex AI, όπου το κόστος είναι 0,50 δολάρια ανά δευτερόλεπτο περιεχομένου. Το Rollout to Gemini Advanced ακολουθεί το σύννεφο της επόμενης ανακοίνωσης 2025 στις 9 Απριλίου και την πρόσβαση προγραμματιστή στις 11 Απριλίου, ολοκληρώνοντας μια στρατηγική εκτόξευσης πολλαπλών επιπέδων. Ρεαλισμός

Σε αντίθεση με τα απλούστερα εργαλεία προτροπής-video, το VEO 2 επιτρέπει στους χρήστες να επηρεάζουν τα κινηματογραφικά χαρακτηριστικά. Οδηγίες όπως”Παρακολουθήστε το θέμα με ρηχό βάθος πεδίου”ή”Χρησιμοποιήστε φακό ευρείας γωνίας”κατανοούνται και αντικατοπτρίζονται στην τελική έξοδο. Η Google δηλώνει ότι το μοντέλο εκπαιδεύτηκε στη”Γλώσσα της Κινηματογραφίας”, επιτρέποντας τον έλεγχο στυλ ειδικού για πυροβολισμό που δεν παρατηρείται συνήθως στις καταναλωτικές πλατφόρμες βίντεο AI. Αυτά τα παραδείγματα, που παρουσιάστηκαν σε πρώιμα demos, κατέδειξαν την ικανότητα του VEO 2 να αναπαράγει τη συμπεριφορά φωτισμού, τη φυσική κίνηση και την πιστότητα της υφής-που προκαλούν τα περισσότερα γενετικά συστήματα βίντεο. Ενώ η Gemini Advanced περιορίζει την παραγωγή σε σύντομη έξοδο χαμηλής ανάλυσης, ο θεμελιώδης κινητήρας παραμένει ο ίδιος. Αυτό δίνει στο VEO ανταγωνιστικό πλεονέκτημα στην οπτική ποιότητα, αν και οι περιορισμοί της βαθμίδας πρόσβασης εξακολουθούν να περιορίζουν την πλήρη απόδοση για τους χρήστες που δεν ανήκουν στο κοινό. Οι δημιουργοί σορτς μπορούν να χρησιμοποιήσουν τη φυσική γλώσσα για να εφαρμόσουν οπτικά στυλ σε κλιπ που παράγονται από AI. 

Αυτά τα εργαλεία βασίζονται στην ίδια υποδομή VEO 2, αλλά με διαφορετικά στρώματα UI και μοντέλα πρόσβασης. Το Gemini Advanced προσφέρει πακέτο πρόσβασης, ενώ το YouTube και τα εργαστήρια αντικατοπτρίζουν τη στρατηγική της Google για την ενσωμάτωση της γενετικής AI σε όλα τα υπάρχοντα δημιουργικά οικοσυστήματα. Οι χρήστες των Δίδυμων πληρώνουν μια επίπεδη μηνιαία συνδρομή και λαμβάνουν έναν ανώτατο αριθμό γενεών, με την Google να σημειώνει ότι οι χρήστες θα «ειδοποιηθούν καθώς πλησιάζουν το μηνιαίο όριο της γενιάς τους» Οι ροές εργασιών Video Enterprise. Αυτοί οι περιορισμοί σηματοδοτούν μια σκόπιμη κλιμακωτή πρόσβαση και απόδοση και απόδοση για την αποφυγή υπερφόρτωσης διακομιστή και υποβάθμιση ποιότητας. Αυτή η αόρατη υπογραφή επιτρέπει την επαλήθευση του περιεχομένου χωρίς να επηρεάζει την ποιότητα. Το σύστημα ευθυγραμμίζεται με τα πρότυπα C2PA και στηρίζει τους ισχυρισμούς της Google για την υπεύθυνη ανάπτυξη του AI. Ωστόσο, μόνο το SynthId δεν μπορεί να επιβάλει πολιτικές χρήσης εκτός εάν οι πλατφόρμες τρίτων υποστηρίζουν την ανίχνευση και την επιβολή της επιβολής-κάτι που εξακολουθεί να είναι ασυνεπές μεταξύ των υπηρεσιών. Ενώ οι δημιουργοί στο YouTube μπορούν να εξαιρεθούν από την εκπαίδευση μοντέλων τρίτων, η εταιρεία διατηρεί δικαιώματα για τη χρήση του δημόσιου περιεχομένου για το δικό της AI. Η πολιτική του YouTube αναφέρει ότι”η πρόσβαση στο περιεχόμενο του δημιουργού με μη εξουσιοδοτημένους τρόπους, όπως η μη εξουσιοδοτημένη απόξεση, παραμένει απαγορευμένη”, αλλά οι επικριτές σημειώνουν ότι αυτό δεν αντιμετωπίζει πλήρως τις ανησυχίες γύρω από τις ακούσιες συνεισφορές μοντέλων. Μέχρι τότε, η κερδοσκοπία συνεχίζεται για το ρόλο των δεδομένων του YouTube στην οικοδόμηση των δυνατοτήτων του VEO. Για παράδειγμα, το μοντέλο χρησιμοποιήθηκε για να βοηθήσει στην ενίσχυση του Wizard of Oz για τον εντυπωσιακό LED Dome στο , συνδυάζοντας το πρωτότυπο υλικό με παρασκήνια. Αυτή η εφαρμογή υπογραμμίζει τη δυνατότητα της VEO να υποστηρίξει την ψηφιακή αποκατάσταση και την επεκτάσιμη αύξηση του περιεχομένου σε επαγγελματικά περιβάλλοντα. Σε στρατηγικό επίπεδο, η Google βλέπει το VEO 2 ως ένα μέρος ενός ευρύτερου εργαλείου AI που περιλαμβάνει το Imagen για την παραγωγή εικόνων, τη Lyria για τη μουσική και το chirp για την ομιλία. Αυτά τα μοντέλα ενσωματώνονται ολοένα και περισσότερο στα LEDEX AI και στο Google Labs για την υποστήριξη της δημιουργίας περιεχομένου cross-media. Ο Διευθύνων Σύμβουλος της DeepMind Demis Hassabis δήλωσε πρόσφατα ότι”η Google θα συνδυάσει τελικά τα μοντέλα Gemini και Veo AI για την ενίσχυση της κατανόησης του φυσικού κόσμου”, μια κίνηση που θα μπορούσε να ανοίξει το δρόμο για ενοποιημένες, πολυτροπικές εφαρμογές AI. Προς το παρόν, η άφιξη του Veo 2 στο Gemini Advanced σηματοδοτεί μια πιο άμεση φιλοδοξία: να δώσει μη εμπειρογνώμονες ένα εργαλείο που μπορεί να ζωντανέψει ιδέες χωρίς να χρειάζεται κάμερες, πληρώματα ή ακριβό λογισμικό επεξεργασίας. Εξακολουθεί να είναι περιορισμένη-με τα επίπεδα της επίλυσης, της διάρκειας και της πρόσβασης-αλλά είναι επίσης το πιο ξεκάθαρο παράδειγμα για την πρόθεση της Google να φέρει γενετικό βίντεο σε καθημερινές δημιουργικές ροές εργασίας.