Η Google κυκλοφόρησε την πιο προηγμένη γεννήτρια βίντεο AI, VEO 3, σε προγραμματιστές, ξεκινώντας σήμερα μια προεπισκόπηση μέσω του Gemini API και της Vertex AI. Η κίνηση, η οποία οι τιμές 720p βίντεο με συγχρονισμένο ήχο στα $ 0,75 ανά δευτερόλεπτο είναι ένα σημαντικό βήμα στη στρατηγική της Google για τη δημιουργία των ισχυρών δημιουργικών εργαλείων. Η απελευθέρωση API ακολουθεί μια γρήγορη σειρά ενημερώσεων που έφεραν πρόσφατα χαρακτηριστικά εικόνας σε video και παγκόσμια πρόσβαση στους συνδρομητές AI της Google. Target=”_ Blank”> Η νέα πρόσβαση προγραμματιστών είναι μια κρίσιμη επέκταση για ένα μοντέλο που μέχρι τώρα ήταν κυρίως ένα χαρακτηριστικό που αντιμετωπίζει οι καταναλωτές. Το API υποστηρίζει επί του παρόντος γενιά κειμένου προς video, με την Google να υποσχεθεί ότι οι δυνατότητες εικόνας προς video βρίσκονται στο δρόμο. Μια ταχύτερη, πιο οικονομικά αποδοτική λειτουργία”VEO 3 Fast”είναι επίσης προγραμματισμένη για μια μελλοντική απελευθέρωση API. Το Google Deepmind VP Eli Collins σημείωσε ότι”το VEO 3 υπερέχει από το κείμενο και την προτροπή εικόνας στη φυσική του πραγματικού κόσμου και τον ακριβή συγχρονισμό των χειλιών”. Αυτή η δυνατότητα ήταν ένα βασικό μέρος της αρχικής αποκάλυψης, με τον Διευθύνοντα Σύμβουλο Demis Hassabis να δηλώνει ότι με αυτή την τεχνολογία”προκύπτουμε από τη σιωπηλή εποχή της γενιάς βίντεο.”
href=”https://console.cloud.google.com/freetrial/?redirectpath=/vertex-ai/studio/media/generate ;tab=video”target=”_ blank”> Ταχεία πρωτότυπα στο Google AI Studio . Αυτό επιτρέπει τον γρήγορο πειραματισμό πριν από τη δέσμευση σε πλήρη ολοκλήρωση, ένα κρίσιμο βήμα δεδομένου του κόστους που βασίζονται στη χρήση. href=”https://developers.googleblog.com/en/veo-3-now-available-gemini-api/”target=”_ blank”> περιεχόμενο brainstorm, επαναλαμβανόμενες και βελτιώνουν την απόδοση . Αυτά τα αρχικά παραδείγματα δείχνουν προς εξαιρετικά εξειδικευμένες, επαγγελματικές ροές εργασίας, όπου το κόστος του μοντέλου μπορεί να δικαιολογηθεί με εξοικονόμηση χρόνου και δημιουργική επιτάχυνση. Η εταιρεία χρησιμοποιεί το VEO 3 για να δημιουργήσει τις ρεαλιστικές και υγρές ανθρώπινες ενέργειες που χρησιμεύουν ως θεμελιώδη δεδομένα για τον αγωγό της, μετατρέποντας την έξοδο AI σε κινούμενα σχέδια χαρακτήρων για τους πελάτες. href=”https://www.youtube.com/watch?v=zki-bltwjx4″target=”_ blank”> Παράγοντας cutscenes βίντεο στο παιχνίδι που προωθούν την ιστορία στο επερχόμενο RPG, Wit’s End. Αυτό επιτρέπει στους σχεδιαστές του να πειραματιστούν γρήγορα με νέες αφηγηματικές ιδέες και γραφικά, ένα βασικό πλεονέκτημα στον επαναληπτικό κύκλο ανάπτυξης παιχνιδιών. Αυτές οι προσεκτικά επιλεγμένες περιπτώσεις χρήσης είναι ιδιαίτερα εξειδικευμένες, γεγονός που μπορεί να υποδηλώνει ότι οι μεγαλύτερες, πιο συνηθισμένες ενσωματώσεις δεν είναι ακόμη έτοιμες για δημόσια ανακοίνωση. Αυτή είναι μια κοινή στρατηγική για την εξέλιξη ισχυρών αλλά ακριβών νέων τεχνολογιών, εστιάζοντας πρώτα στις εξειδικευμένες βιομηχανίες που μπορούν να απορροφήσουν αμέσως το κόστος. Η δομή τιμολόγησης υπογραμμίζει αυτήν την επαγγελματική εστίαση. Σύμφωνα με το Οι επίσημες τιμές της Google , ένα κλιπ οκτώ δευτερολέπτων κοστίζει $ 6, ενώ ένα βίντεο πέντε λεπτών θα τρέξει $ 225. Καθώς η δημιουργία ενός τέλειου αποτελέσματος απαιτεί συχνά πολλαπλές προσπάθειες, το πραγματικό κόστος μπορεί να κλιμακωθεί γρήγορα.
Όπως επισημαίνει μία ανάλυση, δημιουργώντας πέντε λεπτά χρήσιμου υλικού ενδέχεται να απαιτήσει τη δημιουργία δέκα φορές αυτό το ποσό, ενδεχομένως να ωθήσει το συνολικό κόστος προς $ 2.250. Η Google στοιχηματίζει ότι για ορισμένες περιπτώσεις χρήσης, αυτό εξακολουθεί να είναι σημαντικά φθηνότερη από τις παραδοσιακές μεθόδους παραγωγής βίντεο. Η πρόσβαση του προγραμματιστή ακολουθεί την παγκόσμια απελευθέρωση του μοντέλου στους συνδρομητές AI PRO στις αρχές Ιουλίου και την προσθήκη δυνατοτήτων εικόνας προς video μόλις την περασμένη εβδομάδα. Αυτή η δομή δημιουργεί μια σαφή διάκριση μεταξύ του mainstream $ 19.99/μήνα AI Pro Plan, που στοχεύει στη γενική δημιουργική εξερεύνηση και το υψηλόβαθμο 249,99 δολάρια/μήνα AI Ultra Plan για τους επαγγελματίες σας. Το API παρέχει τώρα μια τρίτη, ξεχωριστή πορεία για την πρόσβαση στην τεχνολογία, με στόχο την εμπορική ολοκλήρωση και όχι την ατομική χρήση. Βάζοντας μια τιμή στο πιο προηγμένο μοντέλο βίντεο, η Google κάνει μια σαφή δήλωση σχετικά με τις εμπορικές φιλοδοξίες της στην γενετική αγορά AI. Πρόκειται για ένα βασικό μέρος της δηλωμένης δέσμευσης της Google για την υπεύθυνη ανάπτυξη του AI και την παροχή διαφάνειας για τα μέσα ενημέρωσης που παράγονται από την AI. Ωστόσο, η τεχνολογία δεν είναι μια ασημένια σφαίρα, καθώς τα υδατογραφήματα δεν είναι ανόητοι. Ως σκηνοθέτης Darren Aronofsky για το μέλλον της αφήγησης.”