Shutterstock đã công bố một mô hình cấp phép có đạo đức được thiết kế để định hình lại cách các nhà phát triển AI truy cập vào dữ liệu đào tạo chất lượng cao.

Giấy phép nghiên cứu mới của Shutterstock cho phép các công ty khởi nghiệp AI và nhà phát triển nhỏ hơn đào tạo các hệ thống AI với chi phí hợp lý và có trách nhiệm. Ứng dụng đầu tiên của nó đang hỗ trợ LTXV (LTX Video), một mô hình tạo video theo thời gian thực được phát triển bởi Lightricks.

Bằng cách sử dụng thư viện video HD và 4K khổng lồ của Shutterstock, Lightricks đặt mục tiêu vượt qua các rào cản kỹ thuật trong sản xuất video AI trong khi vẫn tuân thủ các tiêu chuẩn đạo đức. Với thư viện khổng lồ gồm hơn 800 triệu hình ảnh và 55 triệu video clip, Shutterstock hiện phục vụ khoảng 4,1 triệu khách hàng đang hoạt động

“Nhiều công ty và người đào tạo người mẫu đã đi theo con đường thu thập dữ liệu trái phép [thay vì] đầu tư cần thiết để đạt được chất lượng và mức độ tin cậy cần thiết để phát triển các mô hình khả thi về mặt thương mại”, Daniel Mandell, người đứng đầu toàn cầu về cấp phép dữ liệu và AI của Shutterstock cho biết.

“Tuy nhiên, chúng tôi đừng nghĩ rằng đầu tư tài chính sẽ là rào cản đối với những ai muốn bước vào không gian này bằng cách tiếp cận có đạo đức.”

Liên quan: OpenAI phát hành Sora AI Video Generator cho ChatGPT Plus và Người đăng ký chuyên nghiệp

Giấy phép nghiên cứu của Shutterstock: Mô hình cấp phép hai giai đoạn

Giấy phép nghiên cứu của Shutterstock giới thiệu khung cấp phép hai giai đoạn nhằm giải quyết các chi phí quá cao liên quan với đào tạo AI. Trong giai đoạn đầu, các nhà phát triển có thể thử nghiệm các bộ dữ liệu nhỏ hơn để kiểm tra và xác thực.

Sau khi dự án của họ sẵn sàng thương mại hóa, họ có thể chuyển sang giấy phép thương mại đầy đủ. Cách tiếp cận linh hoạt này được thiết kế để giảm bớt các rào cản tài chính khi gia nhập đối với các công ty khởi nghiệp và các tổ chức nhỏ hơn.

Mandell nhấn mạnh rằng Shutterstock nhằm mục đích thiết lập các tiêu chuẩn đạo đức trong việc phát triển AI và đảm bảo đền bù công bằng cho người sáng tạo nội dung.

Một trong những thách thức dai dẳng nhất trong quá trình tạo video AI là duy trì chuyển động mượt mà, mạch lạc trên các khung hình, đặc biệt là trong các clip dài hơn. Kiến trúc của LTXV được thiết kế đặc biệt để giải quyết vấn đề này. Bằng cách đào tạo trên bộ dữ liệu video chất lượng cao và đa dạng của Shutterstock, LTXV đạt được mức độ nhất quán về chuyển động khiến nó khác biệt so với các mô hình cạnh tranh.

“Dữ liệu của Shutterstock cho phép chúng tôi đào tạo các mô hình một cách có trách nhiệm và có đạo đức”, Zeev Farbman cho biết , Giám đốc điều hành của Lightricks. “Sự hợp tác này đảm bảo chúng tôi tôn trọng quyền sáng tạo trong khi thúc đẩy khả năng kỹ thuật của các công cụ của chúng tôi.”

Liên quan: Meta giới thiệu Video Seal Framework cho Video AI ẩn Hình mờ

Đền bù công bằng cho người đóng góp

Những người đóng góp cho nền tảng của Shutterstock được hưởng lợi từ mô hình chia sẻ doanh thu, nhận 20% doanh thu được tạo ra từ các thỏa thuận cấp phép dữ liệu. Ngoài ra, người sáng tạo nội dung có thể từ chối sử dụng tác phẩm của họ cho mục đích đào tạo AI, một lựa chọn được thực hiện bởi ít hơn 1% người đóng góp trên Shutterstock.

Mandell cho rằng tỷ lệ từ chối thấp này là do tính minh bạch và công bằng của mô hình cấp phép.

Sáng kiến ​​này coi Shutterstock là động lực thúc đẩy các hoạt động AI có đạo đức tại thời điểm mà ngành này phải đối mặt với sự giám sát ngày càng tăng về việc tìm nguồn cung cấp dữ liệu. Nhiều vụ kiện đã được đệ trình chống lại các công ty AI bị cáo buộc sử dụng tài liệu có bản quyền trong bộ dữ liệu đào tạo của họ mà không được phép.

Có liên quan: Amazon tiết lộ các mô hình AI đa phương thức Nova cho văn bản, hình ảnh và video

Khả năng của LTXV: Tạo video AI theo thời gian thực

LTXV, do Lightricks phát triển, có thể tạo video nhanh hơn tốc độ phát lại, tạo ra 24 khung hình mỗi giây và cung cấp video có độ phân giải cao trong thời gian ngắn khoảng 30 giây trên phần cứng cao cấp.

LTXV cung cấp nhiều chế độ hoạt động, bao gồm chuyển văn bản thành video, tạo hình ảnh thành video và tạo video thành video. Các tính năng này cho phép người sáng tạo tạo hoạt ảnh, chuyển đổi cảnh quay hiện có hoặc tạo video hoàn toàn mới dựa trên lời nhắc mô tả. Tính linh hoạt của những công cụ này giúp cả nhà làm phim chuyên nghiệp và người sáng tạo độc lập có thể tiếp cận LTXV.

Hình ảnh: lightricks/LTXV

Kỹ thuật Những cải tiến

Mô hình này được xây dựng trên kiến ​​trúc Biến áp khuếch tán (DiT) với hai tỷ tham số, cho phép mô hình chuyển tiếp mượt mà giữa các khung hình và duy trì tính nhất quán trên các clip mở rộng.

Độ phân giải đầu ra mặc định của LTXV là 768×512, nhưng nó có thể mở rộng lên tới 720×1280 trong khi vẫn duy trì hiệu suất. Không giống như nhiều mô hình AI đòi hỏi cơ sở hạ tầng mạnh mẽ, LTXV có thể hoạt động hiệu quả trên GPU cấp độ người tiêu dùng với chỉ 6GB VRAM, mở rộng khả năng tiếp cận cho các studio nhỏ hơn và các nhà phát triển cá nhân.

Có liên quan: Google Vertex AI hiện cung cấp Trình tạo video Veo AI và Mô hình chuyển văn bản thành hình ảnh Imagen 3

Craig Andrews, giám đốc PR toàn cầu tại Lightricks, đã tuyên bố rằng tính nhất quán của chuyển động là một trong những thách thức kỹ thuật lớn nhất trong AI tạo video và giải thích rằng thư viện video của Shutterstock đóng một vai trò thiết yếu trong việc giải quyết vấn đề này.

Hình ảnh: lightricks/LTXV

LTXV được phát hành theo giấy phép Apache 2.0, khiến nó được cung cấp miễn phí để sửa đổi, sử dụng và phân phối lại. Khung nguồn mở này khuyến khích sự hợp tác giữa các nhà phát triển và nhà nghiên cứu đồng thời đảm bảo khả năng tiếp cận cho những người sáng tạo độc lập và doanh nghiệp nhỏ. Mô hình này được lưu trữ trên GitHub và Hugging Face, nơi nó đã được tải xuống hàng nghìn lần.

Ngoài khả năng cung cấp nguồn mở, LTXV còn tích hợp với các nền tảng như ComfyUI, cho phép người dùng tùy chỉnh và điều chỉnh các tính năng của nó cho phù hợp với nhu cầu cụ thể. Mức độ linh hoạt này khiến LTXV trở thành một công cụ có giá trị cho cả chuyên gia kỹ thuật và chuyên gia sáng tạo.

Có liên quan: Adobe ra mắt Công cụ video AI trong Premiere Pro, mở rộng Firefly

Khả năng tạo các clip mở rộng với chất lượng ổn định của LTXV giúp nó có khả năng mở rộng cao cho nhiều ứng dụng khác nhau. Từ thương mại điện tử và quảng cáo tương tác đến phát triển trò chơi và sáng tạo nội dung, tính linh hoạt của mô hình này sẽ mở ra những khả năng mới cho người sáng tạo. Khả năng tương thích với GPU cấp độ người tiêu dùng càng mở rộng sức hấp dẫn của nó, đảm bảo rằng ngay cả các studio nhỏ cũng có thể khai thác khả năng của nó.

Khung cấp phép của Shutterstock cung cấp một giải pháp thay thế tuân thủ có lợi cho cả nhà phát triển và người sáng tạo nội dung. Bằng cách tận dụng các bộ dữ liệu có nguồn gốc hợp đạo đức của Shutterstock, LTXV minh họa cách đổi mới nguồn mở có thể phù hợp với các thực hành đạo đức.

Categories: IT Info