Alibaba Cloud ได้ประกาศลดราคา 85% สำหรับโมเดล AI ที่ใช้เหตุผลเชิงภาพ Qwen-VL-Max การเคลื่อนไหว เกิดขึ้นเมื่อยักษ์ใหญ่ด้านเทคโนโลยีของจีน รวมถึง ByteDance และ Baidu ต่อสู้เพื่อครอบครองภาคส่วน AI ขององค์กรที่เติบโตอย่างรวดเร็ว
ราคาที่ลดลง ซึ่งวางตำแหน่ง Qwen-VL-Max ที่ 0.003 หยวน ($0.00041) ต่อพันโทเค็น สะท้อนให้เห็นถึงกลยุทธ์เชิงรุกของ ByteDance เพื่อลดต้นทุนสำหรับ โมเดล AI การให้เหตุผลด้วยภาพเปิดตัวเมื่อต้นเดือนธันวาคม
ซีรีส์ Qwen-VL ของ Alibaba ครอบคลุมโมเดลขั้นสูงอื่นๆ อีกหลายรุ่นที่ผสานรวมข้อมูลภาพและข้อความสำหรับงานต่างๆ เช่น คำบรรยายภาพ การตอบคำถามด้วยภาพ และการสร้างเนื้อหาต่อเนื่องหลายรูปแบบ กลุ่มผลิตภัณฑ์ประกอบด้วย Qwen-VL, Qwen-VL-Chat, Qwen2-VL และ QVQ-72B-Preview รุ่นทดลอง Qwen2-VL พร้อมประสิทธิภาพที่ล้ำสมัย มีความเป็นเลิศในการวัดประสิทธิภาพอย่าง MathVista และ DocVQA ซึ่งมักจะเหนือกว่าคู่แข่งชั้นนำอย่าง GPT-4V ของ OpenAI และ Gemini Ultra ของ Google
มีมากกว่า 252 โมเดล AI เจนเนอเรชั่นที่ได้รับการอนุมัติในประเทศจีนในปีนี้ ทำให้ตลาดของบริษัทเติบโตขึ้นอย่างรวดเร็ว ส่งผลให้บริษัทต่างๆ หันมาใช้กลยุทธ์การกำหนดราคาและเทคโนโลยีที่เป็นนวัตกรรมใหม่เพื่อรักษาส่วนแบ่งตลาด
การกำหนดราคาเชิงกลยุทธ์เป็นรูปแบบที่สอดคล้องกัน
การประกาศในเดือนธันวาคมถือเป็นการปรับราคา AI ครั้งใหญ่ครั้งที่สามของอาลีบาบาในปี 2567 ตามมาด้วยการลดลง 55% ในเดือนกุมภาพันธ์สำหรับผลิตภัณฑ์คลาวด์หลัก และส่วนลด 97% ในเดือนพฤษภาคมสำหรับชุด Qwen AI ความเคลื่อนไหวเหล่านี้สะท้อนให้เห็นถึงการมุ่งเน้นอย่างต่อเนื่องในเรื่องความสามารถในการจ่าย โดยมีเป้าหมายเพื่อดึงดูดลูกค้าองค์กรที่สำรวจเครื่องมือ AI ขั้นสูงสำหรับกระบวนการทางธุรกิจและการวิเคราะห์
ด้วยการลดต้นทุน อาลีบาบาพยายามวางตำแหน่งข้อเสนอ AI ให้เป็นเครื่องมือที่ขาดไม่ได้สำหรับบริษัทที่ต้องเผชิญกับความซับซ้อน การนำปัญญาประดิษฐ์มาใช้ การเรียกเก็บเงินตามโทเค็นซึ่งเรียกเก็บเงินจากผู้ใช้สำหรับการโต้ตอบ AI เฉพาะเจาะจง ได้กลายเป็นศูนย์กลางของกลยุทธ์การกำหนดราคา ทำให้สามารถเข้าถึงโมเดลอันทรงพลังที่ปรับขนาดได้ โดยไม่ต้องมีการลงทุนล่วงหน้าที่ห้ามปราม
AI ต่อเนื่องหลายรูปแบบที่ล้ำหน้าด้วย QVQ-72B
strong>
เมื่อต้นสัปดาห์ที่ผ่านมา อาลีบาบาได้เปิดตัว QVQ-72B ซึ่งเป็นโมเดล AI แบบโอเพ่นซอร์สหลายรูปแบบที่ผสานความสามารถในการให้เหตุผลด้วยภาพและข้อความ ข่าวประชาสัมพันธ์ฉบับนี้ต่อยอดมาจาก Qwen2-VL-72B ซึ่งเป็นรุ่นก่อนหน้า โดยได้ยกระดับฟังก์ชันการทำงานสำหรับการวิจัยทางวิทยาศาสตร์และการวิเคราะห์ขั้นสูง
เกณฑ์มาตรฐานได้ตรวจสอบความสามารถของ QVQ-72B แล้ว โดยโมเดลดังกล่าวได้รับคะแนน 70.3 บนเกณฑ์มาตรฐาน MMMU— การทดสอบที่ออกแบบมาเพื่อประเมินการใช้เหตุผลหลายรูปแบบในระดับมหาวิทยาลัย และมีความเป็นเลิศใน MathVista และ OlympiadBench ผลลัพธ์เหล่านี้ทำให้ QVQ-72B เป็นหนึ่งในโมเดลโอเพ่นซอร์สที่มีการแข่งขันสูงที่สุดในอุตสาหกรรม
QwQ-32B: โมเดลสำหรับความแม่นยำเชิงตรรกะ
ในเดือนพฤศจิกายน อาลีบาบาเปิดตัว QwQ-32B ซึ่งเป็นโมเดลที่ออกแบบมาเพื่อการให้เหตุผลเชิงตรรกะ การเขียนโค้ด และงานทางคณิตศาสตร์ขั้นสูง คุณสมบัติการประมวลผลเวลาทดสอบจะจัดสรรทรัพยากรการคำนวณเพิ่มเติมระหว่างการดำเนินการ ปรับปรุงความแม่นยำสำหรับปัญหาที่ซับซ้อน แม้ว่าสิ่งนี้จะทำให้เวลาตอบสนองช้าลง แต่ความแม่นยำของ QwQ-32B ก็ได้รับการยกย่องในการวัดประสิทธิภาพและแอปพลิเคชันระดับองค์กร
การเปิดตัว QwQ-32B ภายใต้ลิขสิทธิ์ Apache 2.0 สะท้อนให้เห็นถึงความมุ่งมั่นของอาลีบาบาในการสร้างสมดุลระหว่างการทำงานร่วมกันและการควบคุมที่เป็นกรรมสิทธิ์. ด้วยการมุ่งเน้นไปที่ AI ที่เน้นการให้เหตุผลเป็นหลัก อาลีบาบาจึงแข่งขันโดยตรงกับโมเดลต่างๆ เช่น โมเดล R1-Lite-Preview ของ DeepSeek และโมเดล o1 ของ OpenAI ซึ่งทั้งสองโมเดลให้ความสำคัญกับความลึกเชิงตรรกะและการแก้ปัญหาแบบวนซ้ำ
ภาคส่วน Generative AI ของจีนได้เห็น การแพร่หลายของโมเดลอย่างรวดเร็ว โดยมีข้อเสนอมากกว่า 250 รายการที่ได้รับอนุมัติให้ใช้งานสาธารณะในปี 2567 เพียงปีเดียว ความอิ่มตัวนี้ได้กระตุ้นให้เกิดการแข่งขันที่รุนแรงระหว่างผู้นำในอุตสาหกรรมและบริษัทสตาร์ทอัพ โดยแต่ละแห่งต่างแข่งขันกันเพื่อสร้างความแตกต่างผ่านการกำหนดราคาและคุณลักษณะทางเทคโนโลยีที่เป็นเอกลักษณ์
ตัวอย่างเช่น DeepSeek ได้เน้นย้ำถึงความโปร่งใสด้วยโมเดล R1-Lite-Preview ซึ่ง ใช้การให้เหตุผลแบบลูกโซ่ทางความคิดเพื่อแบ่งปัญหาออกเป็นขั้นตอนที่เพิ่มขึ้น ทำให้ผู้ใช้สามารถติดตามกระบวนการตัดสินใจได้ ในขณะเดียวกัน ByteDance และ Alibaba มุ่งเน้นไปที่ความสามารถในการจ่ายเพื่อผลักดันให้เกิดการยอมรับในตลาดที่มีผู้คนหนาแน่นมากขึ้น