ทีม Qwen ของ Alibaba ได้เปิดตัว Qwen-Image-Edit ซึ่งเป็นโมเดล AI โอเพนซอร์ซใหม่ที่ท้าทายซอฟต์แวร์ระดับมืออาชีพโดยตรงเช่น Adobe Photoshop ซึ่งใช้งานมากกว่า 90% ของผู้เชี่ยวชาญด้านความคิดสร้างสรรค์ของโลก เปิดตัวทั่วโลกเมื่อวันที่ 18 สิงหาคมเครื่องมือนี้อนุญาตให้ทุกคนทำการแก้ไขภาพที่ซับซ้อนโดยใช้ข้อความข้อความง่าย ๆ

รุ่นนี้มีอยู่บนแพลตฟอร์มเช่น qwen chat และผ่าน มันเก่งในการแสดงผลและการปรับเปลี่ยนข้อความภายในภาพทั้งในภาษาอังกฤษและภาษาจีนซึ่งเป็นงานที่ยากสำหรับ ai.

โดยการจัดหาเครื่องมืออันทรงพลังนี้ฟรีภายใต้

คุณสมบัติทั้งสองชุดจะถูกป้อนเข้าไป สิ่งนี้ช่วยให้ระบบสามารถสร้างสมดุลที่แม่นยำในการแก้ไขตามรายงานฉบับเดียวที่ระบุไว้อย่างซื่อสัตย์ต่อความตั้งใจของผู้ใช้และรูปลักษณ์ของภาพต้นฉบับ สถาปัตยกรรมนี้เปิดใช้งานโหมดการแก้ไขที่แตกต่างและทรงพลังสองโหมด

การแก้ไขความหมายครั้งแรกถูกออกแบบมาสำหรับการแปลงในวงกว้างซึ่งเปลี่ยนความหมายหรือสไตล์โดยรวมของภาพ โหมดนี้ อนุญาตให้มีการเปลี่ยนแปลงระดับพิกเซลที่สำคัญทั่วทั้งผืนผ้าใบ ในขณะที่รักษาตัวตนหลักของเรื่อง แอพพลิเคชั่นที่ใช้งานได้จริงรวมถึงการเปลี่ยนสไตล์ของภาพถ่ายเพื่อให้คล้ายกับแอนิเมชั่นสตูดิโอ Ghibli การหมุนวัตถุเพื่อเปิดเผยมุมมองใหม่หรือสร้างแพ็คอีโมจิทั้งหมดจากมาสคอต

โหมดที่สองการแก้ไขลักษณะที่ปรากฏเน้นการปรับเปลี่ยนการผ่าตัด ช่วยให้ผู้ใช้สามารถเพิ่มหรือลบองค์ประกอบเปลี่ยนสีของวัตถุเดียวหรือทำการตกแต่งภาพถ่ายที่ละเอียดอ่อนในขณะที่มั่นใจว่าพื้นที่โดยรอบยังคงไม่เปลี่ยนแปลงอย่างสมบูรณ์ ดังที่นักวิจัยทีม Qwen Junyang Lin กล่าวว่า“ มันสามารถลบเส้นผมได้การปรับเปลี่ยนภาพที่ละเอียดอ่อนมาก”

มาตรฐานใหม่สำหรับการแก้ไขข้อความสองภาษา

ซึ่งเป็นภาพที่ใช้งานได้ แบบจำลองสืบทอดและขยายความสามารถในการแสดงผลสองภาษาที่แข็งแกร่งของรุ่นก่อนหน้ารุ่น Qwen-Image Foundation ซึ่งได้รับการออกแบบมาโดยเฉพาะเพื่อการพิมพ์ดีด สิ่งนี้ช่วยให้สามารถเพิ่มลบหรือแก้ไขข้อความได้อย่างถูกต้องทั้งภาษาอังกฤษและภาษาจีน

คุณลักษณะนี้ระบุถึงจุดอ่อนที่ต่อเนื่องและพื้นฐานในระบบ AI ที่เกิดขึ้นได้ส่วนใหญ่ แบบจำลองการแพร่กระจายมาตรฐานมักจะต่อสู้กับข้อความเพราะประมวลผลภาพเป็นรูปแบบที่กว้างใหญ่ของพิกเซลมากกว่าเป็นตัวละครสัญลักษณ์ สิ่งนี้ทำให้การสะกดคำที่สอดคล้องกันระยะห่างเชิงตรรกะและการพิมพ์ที่สอดคล้องกันเป็นอุปสรรค์ที่สำคัญโดยเฉพาะอย่างยิ่งสำหรับสคริปต์โลจิสติกที่ซับซ้อนเช่นภาษาจีน

Qwen-Image-Edit-Edefices ผ่านการฝึกอบรมพิเศษของสถาปัตยกรรมพื้นฐาน แบบจำลองพื้นฐานได้รับการฝึกฝนโดยใช้วิธีการ”การเรียนรู้หลักสูตร”เริ่มต้นด้วยภาพพื้นฐานก่อนที่จะค่อยๆปรับขนาดเพื่อจัดการคำอธิบายข้อความระดับย่อหน้า สิ่งนี้เสริมด้วยการสังเคราะห์ข้อมูลที่สร้างภาพการฝึกอบรมที่มีคุณภาพสูงและมีคุณภาพสูงการสอนแบบจำลองกฎของการพิมพ์

สำหรับผู้ใช้อย่างมีประสิทธิภาพซึ่งแปลเป็นระดับการควบคุมที่ไม่เคยเกิดขึ้นมาก่อน โมเดลสามารถ

ความสามารถของโมเดลนั้นขยายไปสู่การแก้ไขที่ซับซ้อน ทีม Qwen แสดงให้เห็นว่าผู้ใช้สามารถดำเนินการแก้ไขชุด“ ถูกล่ามโซ่” เพื่อแก้ไขข้อผิดพลาดของตัวละครแต่ละตัวในชิ้นส่วนของการประดิษฐ์ตัวอักษรจีนที่สร้างขึ้นได้อย่างไร โดยการวาดกล่องที่มีขอบเขตในภูมิภาคที่ไม่ถูกต้องและออกข้อความข้อความใหม่ผู้ใช้สามารถ การปรับแต่งศิลปะที่สมบูรณ์แบบ ในตลาดที่มีการแข่งขัน

การตัดสินใจของอาลีบาบาที่จะปล่อย Qwen-Image-edit ภายใต้ มันทำให้เครื่องมือที่ทันสมัยพร้อมใช้งานได้อย่างอิสระสำหรับการใช้งานเชิงพาณิชย์โดยการตัดรูปแบบธุรกิจของผู้เล่นที่จัดตั้งขึ้นโดยตรง

การเปิดตัวเกิดขึ้นเมื่อตลาดการแก้ไข AI ร้อนขึ้น เมื่อเร็ว ๆ นี้ Adobe หนุน Photoshop ด้วยคุณสมบัติที่ขับเคลื่อนด้วย Firefly ใหม่เช่น’Harmonize’สำหรับการผสมวัตถุและ’Generative Upscale’เพื่อการปรับปรุงความละเอียด โมเดลที่ทรงพลังอื่น ๆ จากคู่แข่งเช่น Bytedance และ Black Forest Labs ที่มีความสามารถในการแก้ไขภาพได้เกิดขึ้น

Subramaniam Deepa ของ Adobe กล่าวว่านวัตกรรมล่าสุดมีจุดมุ่งหมายเพื่อขจัดอุปสรรคเชิงสร้างสรรค์โดยระบุว่า“ นวัตกรรมใหม่เหล่านี้มาจากการสนทนาอย่างต่อเนื่องของเรากับชุมชนสร้างสรรค์ วิธีการโอเพนซอร์สของอาลีบาบาแสดงถึงเส้นทางที่แตกต่างและก่อกวนมากขึ้นไปสู่เป้าหมายเดียวกัน

การเปิดตัวครั้งนี้เป็นล่าสุดในการสืบทอด AI โอเพนซอร์สเปิดตัวอย่างรวดเร็วจากอาลีบาบา มันเป็นไปตามการเปิดตัวของรูปแบบการใช้เหตุผลเชิงมาตรฐาน QWEN3-topking และโมเดลการสร้างวิดีโอ WAN2.2 ขั้นสูง

โดยการปล่อยโมเดลเปิดที่ทรงพลังสำหรับการใช้เหตุผลการเข้ารหัสวิดีโอและการแก้ไขภาพตอนนี้ Alibaba กำลังรวบรวมการพัฒนา AI กลยุทธ์นี้มีวัตถุประสงค์เพื่อปลูกฝังชุมชนนักพัฒนาทั่วโลกที่สามารถสร้างขึ้นบนเทคโนโลยีของตนส่งเสริมระบบนิเวศที่สามารถสร้างสรรค์สิ่งใหม่ ๆ ได้เร็วกว่าแพลตฟอร์มที่ปิดและเป็นกรรมสิทธิ์

ความวุ่นวายของกิจกรรมนี้ส่งสัญญาณเชิงกลยุทธ์ออกไปจากรูปแบบ“ การคิดแบบไฮบริด” ที่ซับซ้อน โฆษกของ Alibaba Cloud ยืนยันการเปลี่ยนแปลงนี้อธิบายว่า“ หลังจากพูดคุยกับชุมชนและสะท้อนถึงเรื่องนี้เราได้ตัดสินใจที่จะละทิ้งโหมดการคิดแบบไฮบริดตอนนี้เราจะฝึกอบรมแบบจำลองการสอนและการคิดแยกต่างหากเพื่อให้ได้คุณภาพที่ดีที่สุด” การมุ่งเน้นไปที่โมเดลแบบเปิดที่มีคุณภาพสูงโดยเฉพาะมีจุดมุ่งหมายเพื่อสร้างระบบนิเวศที่ครอบคลุมซึ่งสามารถเปิดระบบปิดระบบปิดที่ควบคุมตลาดได้