Bytedance membuat dorongan bersepadu ke ruang generasi imej AI mewah dengan Seedream 3.0, model yang dibangunkan oleh pasukan biji bait. Dibentangkan sebagai mampu dalam bahasa Cina dan Inggeris, Seedream 3.0 bertujuan tepat pada nama-nama yang ditetapkan seperti GPT-4O dan Midjourney Openai. A

Model ini mula melancarkan Bytedance’s platform sembang doubao dan alat penciptaan Jimeng pada awal April 2025; Doubao sendiri adalah saluran pengedaran yang penting, setelah hampir 100 juta pengguna aktif bulanan di seluruh dunia pada bulan Mac, mewujudkan penonton yang berpotensi besar terutamanya di China. Generasi

Satu kawasan di mana Seedream 3.0 bertujuan untuk membezakan dirinya adalah tipografi. Dokumentasi teknikal menyoroti usaha untuk meningkatkan”penjanaan tipografi halus,”dengan kemajuan”khususnya untuk penambahan teks dalam watak-watak Cina yang rumit yang penting untuk penjanaan tipografi profesional.”Tuntutan Bytedance Ujian dalaman menunjukkan”Kadar ketersediaan teks 94% untuk kedua-dua watak Cina dan Inggeris, dengan berkesan menghapuskan penyajian teks sebagai faktor pembatas dalam penjanaan imej.”keupayaan teks. Fokus ini tiba sebagai model baru yang lain, seperti Reve Image 1.0 yang agresif, juga bersaing sebahagiannya pada kualiti rendering teks. Objektifnya adalah untuk menghasilkan imej dengan ciri-ciri kulit yang lebih naturalistik, bergerak jauh dari estetika yang terlalu banyak diletakkan dalam output AI.

Keupayaan Seedream 3.0 untuk mengeluarkan imej secara asli sehingga resolusi 2K (2048 × 2048 piksel) dibentangkan sebagai faktor penyumbang kepada terperinci tekstur yang lebih baik, berbeza dengan model yang bergantung pada langkah-langkah yang berasingan. Saiz dataset latihan telah meningkat secara substansial, sebahagiannya melalui pendekatan”kecacatan-sedar”yang menutup kelemahan imej kecil daripada membuang data. Model ini juga menggunakan objektif yang sesuai dengan aliran dan kehilangan penjajaran perwakilan (REPA). Untuk memadankan pilihan pengguna yang lebih baik, pembelajaran tetulang menggunakan model bahasa penglihatan yang besar (VLMS), skala sehingga lebih daripada 20 bilion parameter, sebagai hakim ganjaran. Keputusan penanda aras awal diletakkan seedream 3.0 berhampiran bahagian atas Maklum balas pengguna awal mencatatkan ketersediaan percuma dan gaya Generator adalah benih 1.6, alat yang membolehkan pengeditan imej berasaskan teks, termasuk manipulasi teks dalam imej. Secara rasmi digambarkan sebagai dibina pada model t2i benih , ia bersaing dengan ciri-ciri yang disepadukan ke dalam chatt-4o. tugas seperti perubahan teks. Posisi produk benih mensasarkan aplikasi profesional dalam fotografi, seni, dan e-dagang. Walaupun kemajuan ini dibentangkan secara positif, mencapai prestasi yang dituntut sering melibatkan perdagangan, berpotensi termasuk tuntutan pengiraan, yang akan menjadi lebih jelas dengan pengangkatan yang lebih luas dan ujian pihak ketiga.

Categories: IT Info