Bytedance membuat dorongan bersama ke ruang generasi gambar AI kelas atas dengan Seedream 3.0, sebuah model yang dikembangkan oleh tim benih Bytedance-nya. Disajikan sebagai mampu dalam bahasa Cina dan Inggris, Seedream 3.0 bertujuan tepat pada nama-nama mapan seperti Openai’s GPT-4O dan Midjourney.

Bahan hytedance yang menyatakan model ini membuat kemajuan besar dalam menghasilkan gambar fotorealistik, terutama potret, dan penanganan teks yang kompleks, sementara juga menyediakan output yang beresolusi tinggi dan berprestasi. Tinjauan teknis resmi dan platform obrolan Doubao dan alat pembuatan Jimeng pada awal April 2025; Doubao itself is a significant distribution channel, having neared 100 million monthly active users globally by March, establishing a large potential audience primarily in China.

Advancing Text and Portrait Generasi

Satu area di mana Seedream 3.0 berupaya membedakan dirinya adalah tipografi. Dokumentasi teknis menyoroti upaya untuk meningkatkan”generasi tipografi berbutir halus,”dengan kemajuan”khususnya untuk pengikut teks dalam karakter Cina yang rumit yang penting bagi generasi tipografi profesional.”

Ini terkenal bagi audiens target bilingual model, sebagai rendering yang akurat, terutama naskah kompleks, tetap menjadi tantangan bagi banyak gambar AIS. Bytedance mengklaim tes internal menunjukkan “tingkat ketersediaan teks 94% untuk karakter Cina dan Inggris, secara efektif menghilangkan rendering teks sebagai faktor pembatas dalam pembuatan gambar.”

Perbandingan visual yang disediakan oleh Hytedance menunjukkan bahwa fitur-fitur yang lebih baik di ponau-fitur yang diluncurkan, terutama dengan fitur-fitur yang lebih baik daripada fitur-fitur yang lebih efektif daripada fontasi yang lebih efektif daripada GPT-4o. kemampuan. Fokus ini tiba sebagai model baru lainnya, seperti Reve Image 1.0 dengan harga agresif, juga bersaing sebagian pada kualitas rendering teks.

Peningkatan dalam menghasilkan potret manusia yang realistis juga merupakan pusat presentasi Bytedance, mengutip”peningkatan realisme dalam pembuatan potret.”Tujuannya adalah untuk menghasilkan gambar dengan fitur kulit yang lebih naturalistik, bergerak menjauh dari estetika yang terlalu halus yang kadang-kadang terlihat dalam output AI.

Studi preferensi pengguna yang dirujuk oleh hytedance ditempatkan unggulan 3.0 tinggi untuk realisme potret, membandingkan dengan baik dengan v7 alpha pertengahan jurnal (yang debut singkat sebelum detail emerging 3.0 emerging). Kemampuan Seedream 3.0 untuk secara asli mengeluarkan gambar hingga resolusi 2K (2048 × 2048 piksel) disajikan sebagai faktor yang berkontribusi untuk detail tekstur yang lebih baik, kontras dengan model yang mengandalkan langkah-langkah peningkatan yang terpisah.

Laporan teknis dan data kinerja

Pelatihan menggabungkan resolusi dan teknik campuran seperti”tali lintas-modalitas”(Posisi Rotary embedding), sebuah metode yang menyesuaikan informasi posisi berdasarkan konteks, yang bermaksud untuk memperbaiki teks-. Model ini juga menggunakan tujuan pencocokan aliran dan kerugian penyelarasan representasi (REPA). Untuk lebih cocok dengan preferensi pengguna, pembelajaran penguatan menggunakan model bahasa penglihatan besar (VLM), diskalakan hingga lebih dari 20 miliar parameter, sebagai juri hadiah.

Kecepatan generasi diklaim mendapat manfaat dari teknik akselerasi, memungkinkan seedream 3.0 untuk menghasilkan gambar resolusi 1K dalam sekitar 3 detik, menurut Bytedance. Hasil Benchmark Awal Ditempatkan Seedream 3.0 di dekat bagian atas PERNYATAAN PENGEMBALIAN PENGGUNA BRENTICET Di sekitar pengumuman di sekitar tengah 2025. Hasil yang kuat, verifikasi independen di seluruh petunjuk yang beragam diperlukan. Early user feedback noted its initial free availability and stylistic range but also launch limitations like lacking reference image input.

SeedEdit Enters The Image Editing Field

Complementing the Generator adalah Seededit 1.6, alat yang memungkinkan pengeditan gambar berbasis teks, termasuk manipulasi teks dalam gambar. secara resmi digambarkan sebagai dibangun di atas model T2I benih , ia bersaing dengan fitur-fitur yang terintegrasi ke dalam chatgpt melalui gpt-4o. Tugas seperti perubahan teks. Posisi produk seededit menargetkan aplikasi profesional dalam fotografi, seni, dan e-commerce. Sementara kemajuan ini disajikan secara positif, mencapai kinerja yang diklaim sering melibatkan pertukaran, berpotensi termasuk tuntutan komputasi, yang akan menjadi lebih jelas dengan adopsi yang lebih luas dan pengujian pihak ketiga.

Categories: IT Info