Bytedance đang thực hiện một cú đẩy được phối hợp vào không gian tạo hình ảnh AI cao cấp với SEEDREAM 3.0, một mô hình được phát triển bởi nhóm hạt giống bytedance của nó. Được trình bày dưới dạng có khả năng trong cả tiếng Trung và tiếng Anh, SeedReam 3.0 nhắm thẳng vào các tên được thành lập như OpenaiTHER GPT-4O và Midjourney. A Tổng quan về kỹ thuật chính thức Mô hình bắt đầu tung ra Bytedance, Doubao Trò chuyện Nền tảng và Công cụ tạo Jimeng vào đầu tháng 4 năm 2025; Doubao là một kênh phân phối quan trọng, đã gần 100 triệu người dùng hoạt động hàng tháng trên toàn cầu vào tháng 3, thiết lập một đối tượng tiềm năng lớn chủ yếu ở Trung Quốc. Thế hệ

Một khu vực trong đó SeedReam 3.0 tìm cách phân biệt chính nó là kiểu chữ. Các tài liệu kỹ thuật nhấn mạnh những nỗ lực để cải thiện việc tạo kiểu chữ mịn,”với những tiến bộ, đặc biệt là để kết xuất văn bản ở các ký tự Trung Quốc phức tạp, điều quan trọng đối với việc tạo kiểu chữ chuyên nghiệp.”ByTedance tuyên bố các bài kiểm tra nội bộ cho thấy tỷ lệ khả dụng văn bản 94% cho cả ký tự Trung Quốc và tiếng Anh, loại bỏ hiệu quả kết xuất văn bản như một yếu tố hạn chế trong việc tạo hình ảnh.”khả năng. Trọng tâm này xuất hiện như các mô hình mới khác, như Reve Image 1.0 có giá mạnh, cũng cạnh tranh một phần về chất lượng kết xuất văn bản. Mục tiêu là tạo ra hình ảnh với các đặc điểm da tự nhiên hơn, di chuyển ra khỏi thẩm mỹ quá mịn đôi khi được thấy trong đầu ra AI. SEETREAM 3.0 Khả năng xuất ra hình ảnh lên tới độ phân giải tối đa 2K (2048 × 2048 pixel) được trình bày như một yếu tố đóng góp cho chi tiết kết cấu tốt hơn, tương phản với các mô hình dựa trên các bước nâng cấp riêng biệt. Các bộ dữ liệu đào tạo đã tăng lên đáng kể, một phần thông qua phương pháp nhận biết lỗi của người Hồi giáo”che dấu các lỗ hổng hình ảnh nhỏ thay vì loại bỏ dữ liệu. Mô hình cũng sử dụng các mục tiêu phù hợp với dòng chảy và tổn thất căn chỉnh đại diện (REPA). Để phù hợp hơn với sở thích của người dùng, việc học củng cố sử dụng các mô hình ngôn ngữ tầm nhìn lớn (VLM), đã tăng lên tới hơn 20 tỷ thông số, như các thẩm phán phần thưởng. Kết quả điểm chuẩn ban đầu đã đặt SeedReam 3.0 gần đỉnh của Các thử nghiệm cho thấy kết quả mạnh mẽ, cần xác minh độc lập trên các lời nhắc khác nhau là cần thiết. Phản hồi của người dùng sớm Lưu ý về tính khả dụng tự do ban đầu và phạm vi khởi động Trình tạo là Seededit 1.6, một công cụ cho phép chỉnh sửa hình ảnh dựa trên văn bản, bao gồm cả thao tác văn bản trong hình ảnh. được mô tả chính thức như được xây dựng trên mô hình hạt giống T2I , nó cạnh tranh với các tính năng được tích hợp vào Nhiệm vụ như thay đổi văn bản. Định vị sản phẩm hạt giống nhắm mục tiêu các ứng dụng chuyên nghiệp trong nhiếp ảnh, nghệ thuật và thương mại điện tử. Mặc dù những tiến bộ này được trình bày một cách tích cực, nhưng việc đạt được hiệu suất được yêu cầu thường liên quan đến sự đánh đổi, có khả năng bao gồm các nhu cầu tính toán, điều này sẽ trở nên rõ ràng hơn với việc áp dụng rộng hơn và thử nghiệm của bên thứ ba.

Categories: IT Info