ทีม Qwen ของ Alibaba ได้เปิดตัว Qwen-Image-Edit ซึ่งเป็นโมเดล AI โอเพนซอร์ซใหม่ที่ท้าทายซอฟต์แวร์ระดับมืออาชีพโดยตรงเช่น Adobe Photoshop ซึ่งใช้งานมากกว่า 90% ของผู้เชี่ยวชาญด้านความคิดสร้างสรรค์ของโลก เปิดตัวทั่วโลกเมื่อวันที่ 18 สิงหาคมเครื่องมือนี้อนุญาตให้ทุกคนทำการแก้ไขภาพที่ซับซ้อนโดยใช้ข้อความข้อความง่าย ๆ
รุ่นนี้มีอยู่บนแพลตฟอร์มเช่น qwen chat และผ่าน มันเก่งในการแสดงผลและการปรับเปลี่ยนข้อความภายในภาพทั้งในภาษาอังกฤษและภาษาจีนซึ่งเป็นงานที่ยากสำหรับ ai.
โดยการจัดหาเครื่องมืออันทรงพลังนี้ฟรีภายใต้
คุณสมบัติทั้งสองชุดจะถูกป้อนเข้าไป สิ่งนี้ช่วยให้ระบบสามารถสร้างสมดุลที่แม่นยำในการแก้ไขตามรายงานฉบับเดียวที่ระบุไว้อย่างซื่อสัตย์ต่อความตั้งใจของผู้ใช้และรูปลักษณ์ของภาพต้นฉบับ สถาปัตยกรรมนี้เปิดใช้งานโหมดการแก้ไขที่แตกต่างและทรงพลังสองโหมด
การแก้ไขความหมายครั้งแรกถูกออกแบบมาสำหรับการแปลงในวงกว้างซึ่งเปลี่ยนความหมายหรือสไตล์โดยรวมของภาพ โหมดนี้ อนุญาตให้มีการเปลี่ยนแปลงระดับพิกเซลที่สำคัญทั่วทั้งผืนผ้าใบ ในขณะที่รักษาตัวตนหลักของเรื่อง แอพพลิเคชั่นที่ใช้งานได้จริงรวมถึงการเปลี่ยนสไตล์ของภาพถ่ายเพื่อให้คล้ายกับแอนิเมชั่นสตูดิโอ Ghibli การหมุนวัตถุเพื่อเปิดเผยมุมมองใหม่หรือสร้างแพ็คอีโมจิทั้งหมดจากมาสคอต
โหมดที่สองการแก้ไขลักษณะที่ปรากฏเน้นการปรับเปลี่ยนการผ่าตัด ช่วยให้ผู้ใช้สามารถเพิ่มหรือลบองค์ประกอบเปลี่ยนสีของวัตถุเดียวหรือทำการตกแต่งภาพถ่ายที่ละเอียดอ่อนในขณะที่มั่นใจว่าพื้นที่โดยรอบยังคงไม่เปลี่ยนแปลงอย่างสมบูรณ์ ดังที่นักวิจัยทีม Qwen Junyang Lin กล่าวว่า“ มันสามารถลบเส้นผมได้การปรับเปลี่ยนภาพที่ละเอียดอ่อนมาก”
ซึ่งเป็นภาพที่ใช้งานได้ แบบจำลองสืบทอดและขยายความสามารถในการแสดงผลสองภาษาที่แข็งแกร่งของรุ่นก่อนหน้ารุ่น Qwen-Image Foundation ซึ่งได้รับการออกแบบมาโดยเฉพาะเพื่อการพิมพ์ดีด สิ่งนี้ช่วยให้สามารถเพิ่มลบหรือแก้ไขข้อความได้อย่างถูกต้องทั้งภาษาอังกฤษและภาษาจีน
คุณลักษณะนี้ระบุถึงจุดอ่อนที่ต่อเนื่องและพื้นฐานในระบบ AI ที่เกิดขึ้นได้ส่วนใหญ่ แบบจำลองการแพร่กระจายมาตรฐานมักจะต่อสู้กับข้อความเพราะประมวลผลภาพเป็นรูปแบบที่กว้างใหญ่ของพิกเซลมากกว่าเป็นตัวละครสัญลักษณ์ สิ่งนี้ทำให้การสะกดคำที่สอดคล้องกันระยะห่างเชิงตรรกะและการพิมพ์ที่สอดคล้องกันเป็นอุปสรรค์ที่สำคัญโดยเฉพาะอย่างยิ่งสำหรับสคริปต์โลจิสติกที่ซับซ้อนเช่นภาษาจีน
Qwen-Image-Edit-Edefices ผ่านการฝึกอบรมพิเศษของสถาปัตยกรรมพื้นฐาน แบบจำลองพื้นฐานได้รับการฝึกฝนโดยใช้วิธีการ”การเรียนรู้หลักสูตร”เริ่มต้นด้วยภาพพื้นฐานก่อนที่จะค่อยๆปรับขนาดเพื่อจัดการคำอธิบายข้อความระดับย่อหน้า สิ่งนี้เสริมด้วยการสังเคราะห์ข้อมูลที่สร้างภาพการฝึกอบรมที่มีคุณภาพสูงและมีคุณภาพสูงการสอนแบบจำลองกฎของการพิมพ์