Google đã phát hành Veo 3.1, một bản cập nhật quan trọng cho mô hình tạo video AI nhằm nâng cao khả năng kiểm soát nội dung và tính chân thực cho người sáng tạo. Phiên bản mới sắp được triển khai cho công cụ làm phim AI của Google, Flow, giới thiệu các khả năng chỉnh sửa chi tiết hơn.

Người dùng hiện có thể thêm đối tượng vào một cảnh và hưởng lợi từ âm thanh đồng bộ, phong phú hơn trên tất cả các tính năng nâng cao của Flow. Bản cập nhật này cũng giúp cải thiện chất lượng hình ảnh và tuân thủ nhanh chóng, hiện có sẵn trong trình chỉnh sửa Flow, Ứng dụng Gemini và thông qua API Gemini dành cho nhà phát triển.

Động thái này báo hiệu ý định của Google là làm cho các công cụ tổng hợp của mình trở nên mạnh mẽ và trực quan hơn. Kể từ khi Flow ra mắt vào tháng 5, người dùng đã tạo hơn 275 triệu video, cho thấy nhu cầu mạnh mẽ về việc tạo video AI dễ tiếp cận. Việc phát hành này được coi là một động thái cạnh tranh trực tiếp với Sora 2 của OpenAI.

Có nhiều quyền kiểm soát quảng cáo chi tiết hơn

Trong thông báo của mình, Google coi bản cập nhật này là phản hồi trực tiếp đối với phản hồi của người sáng tạo về các công cụ phức tạp hơn dành cho thế hệ sau.

Theo trưởng nhóm sản phẩm Jess Gallegos và Thomas Iljic, “chúng tôi luôn lắng nghe phản hồi của bạn và chúng tôi được biết rằng bạn muốn có nhiều khả năng kiểm soát mang tính nghệ thuật hơn trong Flow, với khả năng hỗ trợ tăng cường cho âm thanh trên tất cả các tính năng.”

Việc tập trung vào việc lặp lại do người dùng định hướng này đánh dấu một sự thay đổi chiến lược, chuyển Flow từ một công cụ tạo thuần túy sang một bộ sáng tạo tương tác và toàn diện hơn.

Trọng tâm của nỗ lực này là một bộ công cụ chỉnh sửa mới trong trình chỉnh sửa Flow được thiết kế cho những khoảnh khắc khi lượt đầu tiên không phải là lượt cuối cùng.

[nội dung nhúng]

Sự bổ sung đáng chú ý nhất là tính năng”Chèn”, cho phép người sáng tạo thêm các yếu tố mới—từ các chi tiết tinh tế, thực tế đến những sinh vật hoàn toàn kỳ ảo—vào một video clip đã được tạo.

Tính năng này được thiết kế để cung cấp cho người dùng khả năng hình dung lại và hoàn thiện cảnh của họ ngay trong ứng dụng, giảm nhu cầu sử dụng phần mềm chỉnh sửa bên ngoài để thực hiện các điều chỉnh và bổ sung nhỏ.

Theo Google, sự tinh tế của mô hình đảm bảo những bổ sung này có vẻ tự nhiên và phù hợp với ngữ cảnh. Veo 3.1 phân tích cảnh hiện có một cách thông minh để xử lý các chi tiết phức tạp như bóng và ánh sáng xung quanh, đảm bảo đối tượng mới được đặt trong môi trường.

Hơn nữa, mô hình còn hoạt động để hòa trộn phần tử được chèn vào phong cách nghệ thuật đã được thiết lập của clip. Khả năng này vượt xa việc sắp xếp đối tượng đơn giản, mang đến một cách năng động và gắn kết hơn để tinh chỉnh nội dung do AI tạo ra.

Bổ sung cho khả năng mới này, Google cũng thông báo rằng tính năng”Xóa”tương ứng sẽ”sắp ra mắt”cho trình chỉnh sửa Flow.

Tính năng này sẽ cho phép người dùng loại bỏ liền mạch các đối tượng hoặc ký tự không mong muốn ra khỏi cảnh. Công ty giải thích rằng Flow sẽ tự động tái tạo lại nền và môi trường xung quanh, làm cho đối tượng trông như thể vật thể chưa từng tồn tại.

Cùng với nhau, các tính năng này thể hiện một bước quan trọng trong việc cung cấp bộ công cụ vẽ trong và vẽ hoàn chỉnh cho video AI.

Từ Silent Clips đến Rich Audio Storytelling

Trọng tâm chính của bản phát hành Veo 3.1 là mở rộng âm thanh khả năng. Dựa trên nền tảng của Veo 3, mô hình đầu tiên của Google tích hợp âm thanh, bản cập nhật hiện mang đến khả năng tạo âm thanh cho các chức năng sáng tạo tiên tiến nhất của Flow.

Cải tiến này giải quyết hạn chế chính của các công cụ video AI trước đây. Như Giám đốc điều hành Google DeepMind, Demis Hassabis đã tuyên bố trước đây, “chúng tôi đang nổi lên từ kỷ nguyên im lặng của việc tạo video”. Bản cập nhật này là một bước quan trọng nhằm thực hiện tầm nhìn đó, bổ sung thêm hội thoại, hiệu ứng âm thanh và tiếng ồn xung quanh.

Việc tập trung vào chủ nghĩa hiện thực là rất quan trọng để tạo ra nội dung đáng tin cậy và hấp dẫn mà không cần tốn nhiều công sức hậu kỳ.

Người sáng tạo giờ đây có thể tạo ra âm thanh phong phú, đồng bộ khi sử dụng các tính năng như “Thành phần cho video”, sử dụng hình ảnh tham chiếu để điều khiển các nhân vật và phong cách. Công cụ”Khung hình thành video”dùng để tạo chuyển tiếp giữa hai hình ảnh giờ đây cũng bao gồm cả âm thanh.

[nội dung được nhúng]

Tính năng”Mở rộng”dùng để tạo các cảnh quay dài hơn, liên tục giờ đây cũng sẽ tạo ra các cảnh âm thanh đi kèm, giúp tính năng này hữu ích hơn cho việc thiết lập các cảnh quay và chuỗi tường thuật dài hơn.

Triển khai chiến lược trong Cuộc đua video AI

Google đang triển khai Veo 3.1 trên toàn bộ bộ sản phẩm AI của mình để tối đa hóa phạm vi tiếp cận. Ngoài trình chỉnh sửa Flow dành cho người tiêu dùng và ứng dụng Gemini, mô hình này hiện có sẵn cho các nhà phát triển và khách hàng doanh nghiệp.

Các nhà phát triển có thể truy cập Veo 3.1 và các tính năng mới của nó thông qua bản xem trước trả phí trong API Gemini, cho phép họ tích hợp video mạnh mẽ khả năng tạo ra các ứng dụng của riêng họ. Khách hàng doanh nghiệp có thể tận dụng mô hình này thông qua Vertex AI.

Chiến lược phân phối đa hướng này cho thấy tham vọng cạnh tranh của Google trong lĩnh vực đang phát triển nhanh chóng Video AI. Việc phát hành diễn ra ngay sau khi ra mắt ứng dụng Sora 2 của OpenAI gây tranh cãi, ứng dụng này đã vấp phải phản ứng dữ dội ngay lập tức về các lo ngại về bản quyền và giả mạo sâu.

Ngược lại, Google tiếp tục nhấn mạnh cam kết của mình đối với AI có trách nhiệm, nhúng hình mờ SynthID vào tất cả nội dung được tạo. Chiến lược này dường như được tính toán để định vị Veo như một giải pháp thay thế ổn định hơn và sẵn sàng cho doanh nghiệp.

Bản cập nhật cũng củng cố chiến lược đăng ký hai tầng rõ ràng của Google, bổ sung thêm giá trị hữu hình cho các kế hoạch AI Pro và AI Ultra nhằm khuyến khích áp dụng và xây dựng cơ sở người dùng trung thành.

Định hình tương lai của ngành làm phim AI

The sự phát triển nhanh chóng của các công cụ video tổng hợp được kỳ vọng sẽ chuyển đổi các ngành công nghiệp sáng tạo. Việc giới thiệu các điều khiển chỉnh sửa chi tiết và âm thanh tích hợp trong Veo 3.1 giúp hạ thấp rào cản kỹ thuật để sản xuất video chất lượng cao, cho phép người kể chuyện lặp lại các ý tưởng nhanh hơn.

Khi các nền tảng này trưởng thành, chúng ngày càng trở thành một phần không thể thiếu trong quy trình làm việc sáng tạo, từ viết kịch bản phân cảnh đến sản phẩm cuối cùng. Trọng tâm đang chuyển từ đầu ra văn bản thành video đơn giản sang quy trình mang tính tương tác và cộng tác nhiều hơn giữa người sáng tạo và mô hình AI.

Categories: IT Info