Google tung ra mô hình video Veo 2 AI và tiết lộ trình tạo âm nhạc Lyria AI - All Things Windows

Google đang mở rộng bộ công cụ trí tuệ nhân tạo của mình cho các khách hàng doanh nghiệp, tiết lộ các bản cập nhật đáng kể cho các mô hình tạo phương tiện truyền thông của nó trong Thể hiện sự theo dõi nhanh chóng, mô hình tạo video của công ty VEO 2 bắt đầu xuất hiện cho người dùng được chọn vào ngày 11 tháng 4, có thể truy cập thông qua Google. Trục triển cung cấp một số trải nghiệm thực hành người dùng có trụ sở tại Hoa Kỳ với VEO 2. Truy cập sớm xuất hiện bị hạn chế và người dùng bên ngoài Hoa Kỳ có thể cần các cách giải quyết kỹ thuật như VPN để thậm chí xem tùy chọn này. Các khả năng hiện tại, theo báo cáo của những người thử nghiệm sớm và được xác nhận trong blog nhà phát triển Google, được đặt ở độ phân giải 720p và 24 khung hình mỗi giây, với thời lượng video tối đa là 8 giây. Việc triển khai ban đầu này theo thông báo tiếp theo của đám mây trong đó Google chi tiết mới VEO 2 tính năng nhập bản xem trước trên Vertex AI, bao gồm nâng cao

Cùng với video, Google đã giới thiệu Lyria, mô hình AI văn bản trên âm nhạc của nó hiện đang trong bản xem trước riêng tư trên Vertex AI cho khách hàng được phê duyệt thông qua Google đề xuất Lyria có thể tạo ra các bản nhạc hoàn chỉnh trên các thể loại khác nhau từ các hướng dẫn văn bản, có khả năng hỗ trợ các doanh nghiệp trong việc tạo ra âm thanh tùy chỉnh cho các chiến dịch tiếp thị hoặc trải nghiệm nhập vai, có khả năng giảm sự phụ thuộc vào các thư viện âm nhạc truyền thống và sự phức tạp của chúng tôi. Chirp 3, mô hình tạo và hiểu âm thanh của Google, thường có sẵn trên Vertex AI. Theo giai đoạn xem trước trước đó được báo cáo vào khoảng tháng 3 năm 2025, Chirp 3 hiện chính thức bao gồm một tính năng giọng nói tùy chỉnh ngay lập tức, mà Google tuyên bố có thể sao chép một giọng nói từ 10 giây âm thanh.

Tính năng này hỗ trợ Nhiều tùy chọn loa và hoạt động theo quy trình xác minh đã nêu để kiểm tra các quyền sử dụng thích hợp. Chirp 3 cũng giới thiệu một công cụ phiên mã được thiết kế để phân biệt giữa các loa khác nhau trong các bản ghi.

Tạo hình ảnh đã bị bỏ lại. Imagen 3, đã chứng kiến một buổi giới thiệu xem trước trước đó trên Vertex AI, đã nhận được các cải tiến thêm được công bố tại Cloud Next. Những cải tiến này tập trung vào việc xây dựng lại các bộ phận hình ảnh bị thiếu (inpainting) và loại bỏ đối tượng chất lượng cao hơn, nhằm mục đích đầu ra hình ảnh thực tế và chi tiết hơn so với các phiên bản trước. Blog chính thức của Google đã nhấn mạnh Vertex AI là cung cấp duy nhất các mô hình tổng quát kéo dài video, hình ảnh, lời nói và âm nhạc. Chiến lược này đặt Google cạnh tranh trực tiếp với các nền tảng AI Cloud AI khác như Amazon Bedrock. Sự kiện tiếp theo của đám mây cũng chứng kiến các thông báo AI rộng hơn, bao gồm silicon tùy chỉnh mới như Ironwood TPU và các khung như Bộ phát triển tác nhân (ADK), báo hiệu một trọng tâm AI trên phạm vi cho khách hàng Google Cloud. Google tuyên bố rằng các phương tiện truyền thông được tạo ra bởi các mô hình mới hơn như Imagen, Veo và Lyria kết hợp các hình mờ tổng hợp. Công ty cũng đề cập đến các biện pháp bảo vệ tích hợp chống lại việc tạo nội dung có hại và quy trình xác minh cụ thể cho công cụ nhân bản giọng nói. Đây vẫn là một chủ đề nhạy cảm trên toàn ngành, với

Categories: IT Info