Runway đã giới thiệu mô hình tạo video AI Gen-4 của mình, trình bày một cách tiếp cận nhằm giảm chi phí chỉnh sửa thủ công cho người tạo nội dung. CompanyClaims Gen-4 là một trong những trình tạo video được hỗ trợ AI có độ chính xác cao nhất cho đến nay. Mặc dù mức độ chi tiết này có thể nâng cao giá trị sản xuất, một số chuyên gia cho rằng nó cũng có thể đặt ra nhu cầu nặng hơn đối với phần cứng. src=”https://winbuzzer.com/wp-content/uploads/2025/03/runway-gen-4.jpg”>
Theo blog chính thức của công ty cảnh báo rằng GPU kết thúc cao có thể là cần thiết để giữ cho thời gian hiển thị có thể quản lý được, đặc biệt là khi tạo ra các chuỗi phức tạp hoặc dài. như hoạt hình khuôn mặt hoặc chi tiết nền.
Trong thực tế, điều này có nghĩa là bắt đầu với các bản xem trước độ phân giải nhanh, thấp, đảm bảo rằng độ dài tiêu cự và phối màu cảm thấy đúng mà không cam kết với thời gian kết xuất dài. Người dùng muốn duy trì một bầu không khí nhất quán trên nhiều clip thường sử dụng các loại ống kính đồng đều, góc chiếu sáng hoặc bộ lọc màu. Khi một bản xem trước phù hợp với tầm nhìn sáng tạo, việc chuyển sang độ phân giải cao hơn sẽ củng cố giao diện cuối cùng. Người sáng tạo có thể xác định một cài đặt muộn vào buổi chiều trong một lời nhắc, chuyển sang môi trường trong nhà tiếp theo và giữ các biểu thức ký tự hoặc chiếu sáng chuyển đổi thống nhất bằng cách mang qua một số thông số nhất định. nó Cách tiếp cận tích hợp này cho phép các nhóm tinh chỉnh hình ảnh của họ dần dần, xây dựng hướng tới các đầu ra gắn kết cân bằng nghệ thuật với hiệu quả kỹ thuật. Các đường dẫn được điều chỉnh, lưu người tạo khỏi phỏng đoán trong các phiên chỉnh sửa. Đồng thời, các phương pháp khuếch tán được cải thiện làm giảm độ méo trong môi trường phức tạp, dẫn đến việc đóng khung phù hợp hơn với một tài sản cho các nhà làm phim nhằm giữ một cái nhìn gắn kết trên nhiều bức ảnh. Gán ánh xạ khuôn mặt chi tiết cho các ký tự trong khi vẫn khám phá các trình tự phân loại màu nâng cao hoặc nhiều chuỗi, tất cả trong một giao diện. Tuy nhiên, khả năng tăng lên có thể đòi hỏi nhiều bộ nhớ và tài nguyên GPU hơn. Mỗi cảnh trong phim được tạo ra bằng cách kết hợp đầu tiên hình ảnh tham chiếu thực của động vật với những bức ảnh thực sự của New York bằng Gen-4, pic.twitter.com/nuqgviz href=”https://twitter.com/runwayml/status/1906718942938169699?ref_src=twsrc%5etfw”Target=”_ Blank”> ngày 31 tháng 3 Thay vì tung hứng nhiều ứng dụng độc lập, giao diện hợp nhất của Gen-4 cho phép các nhóm phim và người tạo độc lập như vậy để duy trì động lượng mà không cần chuyển đổi phần mềm. Phim theo một nhóm các nhà thám hiểm tìm kiếm một bông hoa bí ẩn. Được thực hiện hoàn toàn với Gen-4 trong vòng chưa đầy một tuần. href=”https://twitter.com/runwayml/status/1906718947195461886?ref_src=twsrc%5etfw”Target=”_ Blank”>
Runway không đơn độc trong việc theo đuổi video AI nâng cao. Tháng 12 năm ngoái, OpenAI đã ra mắt Sora, cung cấp đầu ra văn bản-đến video và một hệ thống dựa trên tín dụng cho người dùng TATGPT. Google đã trả lời với Veo 2 ngay sau đó, thêm độ phân giải 4K và hình mờ vô hình.
Trong một bước ngoặt khác, Trung Quốc Alibaba đã tiết lộ WAN 2.1 vào tháng 2 này, cung cấp một nền tảng cung cấp mở mà không có Paywalls. Mỗi người tham gia phục vụ cho các ưu tiên cụ thể, một số người nhấn mạnh vào giải quyết, những người khác tập trung vào khả năng tiếp cận hoặc trong trường hợp Gen-4, thao tác cảnh sâu hơn. Những người theo dõi ngành công nghiệp dự đoán rằng các điểm chuẩn độc lập cuối cùng sẽ xác nhận liệu kết quả của Gen-4 có duy trì sự ổn định ở mức độ trung thực cao hay không. Vào tháng 9 năm 2024, Runway đã tiết lộ API API Gen-3 Alpha Turbo, cung cấp nâng cấp tốc độ cho các doanh nghiệp tích hợp video AI vào các đường ống sản xuất. Những phát triển đó đã định hình cơ sở của Gen-4, hướng dẫn nhắc nhở hiện đang vượt ra ngoài ánh xạ mặt để bao gồm toàn bộ cảnh, phân loại màu và nhiều đường dẫn camera.
Về mặt thực tế, việc củng cố các chức năng này có thể làm giảm chi phí sản xuất dài hạn. Tuy nhiên, tác động thực sự vẫn được kiểm tra trên các thiết lập phần cứng khác nhau, trong đó việc sử dụng bộ nhớ và tốc độ hiển thị có thể là mấu chốt cho các dự án quy mô lớn.