Nhóm Qwen của Alibaba, đã ra mắt Qwen-Image-Edit, một mô hình AI nguồn mở mới, trực tiếp thách thức phần mềm chuyên nghiệp như Adobe Photoshop, được sử dụng bởi hơn 90% các chuyên gia sáng tạo thế giới. Được phát hành trên toàn cầu vào ngày 18 tháng 8, công cụ cho phép mọi người thực hiện các chỉnh sửa hình ảnh phức tạp bằng cách sử dụng các lời nhắc văn bản đơn giản. Target=”_ Blank”> Qwen Chat , và thông qua cho phép thay đổi cấp độ pixel đáng kể trên toàn bộ khung vẽ trong khi vẫn duy trì nhận dạng cốt lõi của đối tượng. Các ứng dụng thực tế bao gồm thay đổi kiểu hình ảnh để giống với hoạt hình studio Ghibli, xoay một đối tượng để tiết lộ quan điểm mới hoặc tạo toàn bộ gói biểu tượng cảm xúc từ linh vật. Nó cho phép người dùng thêm hoặc xóa các phần tử, thay đổi màu của một đối tượng hoặc thực hiện chỉnh sửa ảnh tinh tế trong khi đảm bảo các khu vực xung quanh vẫn hoàn toàn không thay đổi. Như nhà nghiên cứu của nhóm Qwen Junyang Lin đã lưu ý, thì Nó có thể loại bỏ một sợi tóc, sửa đổi hình ảnh rất tinh tế.”Mô hình kế thừa và mở rộng khả năng kết xuất song ngữ mạnh mẽ của người tiền nhiệm, mô hình nền tảng QWEN-IMAGE, được thiết kế đặc biệt để đánh máy chính. Điều này cho phép nó thêm chính xác, xóa hoặc sửa đổi văn bản bằng cả tiếng Anh và tiếng Trung. Các mô hình khuếch tán tiêu chuẩn thường đấu tranh với văn bản vì chúng xử lý hình ảnh như các mẫu pixel rộng lớn hơn là các ký tự tượng trưng. Điều này làm cho chính tả mạch lạc, khoảng cách logic và kiểu chữ nhất quán trở thành một trở ngại lớn, đặc biệt đối với các tập lệnh logographic phức tạp như tiếng Trung. Mô hình nền tảng đã được đào tạo bằng cách sử dụng phương pháp học tập giảng dạy”, bắt đầu bằng các hình ảnh cơ bản trước khi dần dần mở rộng để xử lý các mô tả văn bản ở cấp độ. Điều này được bổ sung bởi một đường ống tổng hợp dữ liệu tạo ra các hình ảnh đào tạo giàu chất lượng, giàu văn bản, dạy một cách hiệu quả mô hình các quy tắc kiểu chữ.
Đối với người dùng, điều này chuyển thành một mức độ kiểm soát chưa từng có. Mô hình có thể
Alibaba quyết định phát hành Qwen-Image-Edit theo Giấy phép cho phép là một chiến lược rõ ràng. Nó làm cho một công cụ tiên tiến có sẵn miễn phí cho sử dụng thương mại, trực tiếp cắt giảm các mô hình kinh doanh của những người chơi đã thành lập. Adobe gần đây đã củng cố Photoshop với các tính năng chạy bằng lửa mới như ‘hài hòa hóa để pha trộn các đối tượng và‘ cao cấp phát triển để tăng cường độ phân giải. Các mô hình mạnh mẽ khác từ các đối thủ cạnh tranh như Bytedance và Black Forest Lab với khả năng chỉnh sửa hình ảnh cũng đã xuất hiện. Cách tiếp cận nguồn mở của Alibaba, đại diện cho một con đường khác nhau, đột phá hơn đến cùng một mục tiêu. Nó theo sự ra mắt của mô hình lý luận suy nghĩ về QWEN3 trên điểm chuẩn và mô hình tạo video WAN2.2 nâng cao của nó. Chiến lược này nhằm mục đích nuôi dưỡng một cộng đồng nhà phát triển toàn cầu có thể xây dựng dựa trên công nghệ của nó, thúc đẩy một hệ sinh thái có khả năng đổi mới nhanh hơn các nền tảng độc quyền, đóng cửa. Người phát ngôn của Alibaba Cloud đã xác nhận sự thay đổi này, giải thích sau khi thảo luận với cộng đồng và phản ánh về vấn đề này, chúng tôi đã quyết định từ bỏ chế độ tư duy lai. Bây giờ chúng tôi sẽ đào tạo các mô hình hướng dẫn và suy nghĩ riêng biệt để đạt được chất lượng tốt nhất có thể.”Sự tập trung này vào các mô hình mở chuyên ngành, chất lượng cao nhằm mục đích xây dựng một hệ sinh thái toàn diện, có thể giới thiệu các hệ thống khép kín thống trị thị trường.