Microsoft telah melancarkan semula kemas kini terbaharunya kepada Bing Image Creator, kembali kepada versi model DALL-E yang lebih awal selepas aduan pengguna yang meluas tentang kualiti imej yang berkurangan.
Kemas kini Disember 2024 memperkenalkan PR16, lelaran baharu DALL-E 3 OpenAI, dengan janji pemaparan yang lebih pantas dan kesetiaan visual yang dipertingkatkan. Walau bagaimanapun, maklum balas pengguna mendedahkan kelemahan ketara dalam output model, mendorong Microsoft memulihkan model PR13 sebelumnya sambil menyiasat isu tersebut.
Pada terasnya, DALL-E 3 ialah model penjanaan imej termaju yang mampu mencipta visual daripada penerangan teks terperinci. Penyepaduan Microsoft DALL-E 3 ke dalam Bing Image Creator membolehkan pengguna menjana visual tersuai terus dalam antara muka carian Bing. Sistem ini juga termasuk ciri-ciri seperti”meningkatkan”, yang mengutamakan permintaan pengguna tertentu untuk pemprosesan yang lebih pantas.
Berkaitan: xAI Elon Musk Menunjukkan Perkasa Penjana Imej Aurora AI
PR16: Kemas Kini Menjanjikan Yang Melepaskan Tanda
Apabila Microsoft mengintegrasikan PR16 ke dalam Bing Image Creator, ia menekankan peningkatan kelajuan dan visual. Jordi Ribas, Microsoft Naib Presiden Korporat Carian dan AI, menjelaskan,”penanda aras dalaman mendapati kualiti PR16 lebih baik secara purata”daripada PR13. Kemas kini adalah sebahagian daripada usaha Microsoft untuk menambah baik ekosistem AInya dengan menyepadukan keupayaan lanjutan daripada DALL-E 3 OpenAI.
Walaupun ada dakwaan ini, pengalaman pengguna menyimpang dengan ketara daripada jaminan Microsoft. Di seluruh platform seperti Reddit dan X (dahulunya Twitter), pengguna menyifatkan imej yang dijana PR16 sebagai”tidak bermaya,””kartun”dan kurang terperinci.
Saya tidak tahu siapa yang anda fikir anda bergurau dengan ini. DALL-E secara objektif lebih teruk berbanding sebelum ini selepas”kemas kini”ini dan anda dikalahkan oleh syarikat lain seperti Google. Ia benar-benar malam dan siang membandingkan kualiti imej sekarang dengan hanya beberapa bulan yang lalu pic.twitter.com/EdSdk7aign
— ke luar (@ roccynoxy) 19 Disember 2024
Aduan khusus termasuk imej yang terlalu terang, tekstur yang salah letak, dan ton warna tidak semulajadi, seperti warna hijau yang meresap. Seorang Pengguna Reddit menggambarkan kekecewaan mereka dengan menyatakan bahawa model itu tidak lagi sepadan dengan pengalaman mereka sebelum ini dinikmati dengan DALL-E.
Isu dengan elemen visual yang rumit, seperti corak renda dan pakaian berlapis, amat ketara. Pengguna yang cuba menjana watak gaya anime menyerlahkan bahawa PR16 memberikan imej dalam kualiti yang jauh lebih rendah menggunakan gesaan yang sama.
Cabaran Rendering Lebih Luas dengan DALL-E 3
Walaupun Microsoft menghadapi kritikan ketara untuk pelancaran PR16nya, isu itu tidak diasingkan kepada Pencipta Imej Bing. Sejak November 2024, pengguna integrasi ChatGPT OpenAI dengan DALL-E 3 telah melaporkan kegagalan pemaparan yang serupa, termasuk herotan warna, salah letak tekstur dan anomali pencahayaan.
Pemerhatian daripada forum komuniti OpenAI mendedahkan bahawa masalah ini tidak berakar pada model DALL-E 3 itu sendiri tetapi dalam sistem perantaraan yang bertanggungjawab untuk menterjemahkan gesaan pengguna ke dalam arahan pemaparan.
Berkaitan: Penjana Imej AI Imagen 3 Google Kini Boleh Diakses di AS
Menurut analisis terperinci di forum, isu itu mungkin berpunca daripada kegagalan dalam penghuraian segera dan saluran paip arahan. Sistem terjemahan segera dalam DALL-E PR16 nampaknya memperkenalkan kesamaran yang membawa kepada output yang tidak konsisten.
Contohnya, gesaan yang melibatkan gaya pakaian yang kompleks, seperti gaun Rococo atau rekaan Gothic Lolita, sering mengakibatkan corak yang salah letak, tekstur yang tidak betul, dan sisihan gaya.
Menariknya, isu ini tidak universal. Platform seperti Coze.com, yang menggunakan saluran paip penyepaduan alternatif untuk DALL-E 3, sebahagian besarnya telah mengelakkan kecacatan pemaparan yang diperhatikan dalam Bing Image Creator dan ChatGPT. Percanggahan ini menunjukkan bahawa masalah terletak pada sistem perantaraan khusus yang digunakan oleh OpenAI dan Microsoft, dan bukannya model AI teras.
Berkaitan: Freepik Mystic Takes on Midjourney, Dall-E in Penjanaan Imej AI
Tindak Balas Microsoft dan Rollback
Mengakui maklum balas pengguna, Microsoft memulakan pengembalian ke PR13. Ribas mengumumkan keputusan pada X, dengan menyatakan: “Terima kasih sekali lagi atas maklum balas dan kesabaran. Kami telah dapat [menghasilkan semula] beberapa isu yang dilaporkan dan merancang untuk kembali kepada PR13 sehingga kami dapat membetulkannya. Malangnya, proses penyebaran sangat perlahan. Ia bermula lebih seminggu yang lalu dan akan mengambil masa 2-3 minggu lagi untuk mencapai 100%.”
Pemulihan itu telah pun selesai sebahagiannya, dengan pengguna Pro dan kira-kira 25% permintaan yang dirangsang kini menggunakan PR13. pengembalian secara beransur-ansur mencerminkan kerumitan mengemas kini sistem AI berskala besar, terutamanya apabila menangani saluran paip bersepadu yang mendalam seperti yang terdapat dalam Bing Image Creator.
Implikasi yang Lebih Luas untuk AI Deployment
Perjuangan Microsoft dengan PR16 menggemakan cabaran serupa yang dihadapi oleh gergasi teknologi lain dalam menggunakan model AI termaju Sebagai contoh, pada awal tahun 2024, Google terpaksa menggantung ciri penjanaan imej Gemini chatbot selepas itu. alat menghasilkan keluaran yang menyinggung kaum dan sejarah yang tidak tepat
Insiden ini menyerlahkan kesukaran yang wujud untuk menjajarkan AI kemajuan dengan jangkaan pengguna, terutamanya untuk aplikasi kreatif seperti penjanaan imej.
Sistem AI seperti DALL-E 3 bergantung pada berbilang lapisan pemprosesan untuk mentafsir dan melaksanakan gesaan pengguna. Walaupun keupayaan model teras kekal teguh, kelemahan dalam sistem perantaraan boleh menjejaskan prestasi dengan ketara. Kes ini menggambarkan bahawa walaupun salah jajaran kecil dalam penghuraian segera atau saluran paip pemaparan boleh mengakibatkan ketidakpuasan hati pengguna yang ketara.
Walau bagaimanapun, pelancaran PR16 mendedahkan cabaran sistemik dalam mengekalkan konsistensi Isu seperti salah letak tekstur, masalah kesetiaan warna dan pencahayaan artifak menyerlahkan keseimbangan halus antara meningkatkan kelajuan dan memastikan ketepatan dalam rendering. Cabaran ini diburukkan lagi oleh kerumitan gesaan pengguna yang semakin meningkat, yang sering menggabungkan penerangan gaya dan bahan yang rumit.
Walaupun penanda aras memberikan cerapan berharga tentang prestasi teknikal, aplikasi dunia nyata sering mendedahkan isu yang tidak dapat diramalkan oleh ujian dalaman.
Selain itu, percanggahan antara platform seperti Coze.com dan Bing Image Creator mencadangkan bahawa menapis sistem perantaraan adalah penting untuk meningkatkan prestasi keseluruhan.
Menangani cabaran ini memerlukan lebih banyak usaha kolaboratif antara pembangun, penyepadu platform dan pengguna akhir untuk memastikan sistem AI memenuhi jangkaan teknikal dan estetik.