อาลีบาบากำลังเร่งการแข่งขัน AI ทั่วโลกกับ Websailor ตัวแทนเว็บโอเพนซอร์ซใหม่ที่เปิดตัวเมื่อวันที่ 4 กรกฎาคมพัฒนาโดย Tongyi Lab ของมัน Websailor ได้รับการออกแบบมาเพื่อควบคุมงานการค้นหาข้อมูลที่ซับซ้อนสูง บริษัท อ้างว่าตัวแทนปิดช่องว่างประสิทธิภาพด้วยระบบที่เป็นกรรมสิทธิ์ชั้นนำจากคู่แข่งเช่น Openai.
โดยใช้วิธีการฝึกอบรมใหม่ที่มุ่งเน้นไปที่ปัญหาที่ไม่แน่นอนสูง Websailor สามารถนำทางภูมิทัศน์ดิจิตอลขนาดใหญ่เพื่อค้นหาคำตอบ การเปิดตัวเชิงกลยุทธ์นี้ มีอยู่ใน GitHub ตั้งเป้าหมายที่จะสร้างตำแหน่งของ Alibaba การให้เหตุผล
หัวใจสำคัญของ Websailor เป็นกลยุทธ์การฝึกอบรมที่ซับซ้อนที่ออกแบบมาเพื่อสอนแบบจำลองวิธีจัดการความคลุมเครือ วิธีการดังกล่าวก้าวข้ามการตอบคำถามอย่างง่ายโดยมุ่งเน้นไปที่สิ่งที่นักวิจัยเรียกว่า”ระดับ 3″ปัญหา: งานที่ไม่มีเส้นทางการแก้ปัญหาที่ชัดเจนซึ่งต้องมีการสำรวจลึก
เพื่อสร้างความท้าทายเหล่านี้ทีมได้สร้าง sailorfog-qa มันสร้างกราฟความรู้ที่ซับซ้อนจากเว็บไซต์ในโลกแห่งความเป็นจริงจากนั้นจงใจปิดบังข้อมูลอย่างจงใจ-เช่นการเปลี่ยนวันที่แม่นยำเป็นช่วงเวลาที่คลุมเครือ-เพื่อบังคับให้ตัวแทนให้เหตุผลและเชื่อมต่อข้อเท็จจริงที่แตกต่างกัน
เป้าหมาย “ การก้าวข้ามข้อ จำกัด ด้านความรู้ความเข้าใจของมนุษย์แสดงให้เห็นถึงพรมแดนที่สำคัญในการฝึกอบรม LLM” ทีมยังหลีกเลี่ยงการเลียนแบบการใช้เหตุผลอันยาวนานของแบบจำลองครูโดยตรง แต่พวกเขาสร้างความคิดที่กระชับโดยมุ่งเน้นการกระทำสำหรับข้อมูลการฝึกอบรมป้องกัน“ การปนเปื้อนโวหาร”
ข้อมูลนี้ใช้ในระบบการฝึกอบรมสองขั้นตอน มันเริ่มต้นด้วยการสุ่มตัวอย่างการปฏิเสธการปรับจูน (RFT)“ เริ่มต้นเย็น” เพื่อสร้างทักษะพื้นฐาน ตามด้วยการเรียนรู้การเสริมแรงโดยใช้อัลกอริทึมที่กำหนดเองซ้ำการเพิ่มประสิทธิภาพนโยบายการสุ่มตัวอย่าง (DUPO) เพื่อปรับแต่งกลยุทธ์การสำรวจของตัวแทนได้อย่างมีประสิทธิภาพ
การตั้งค่าการเปิดแหล่งโอเพ่นซอร์ส ตามเกณฑ์มาตรฐานที่ตีพิมพ์รุ่น 72B ของรุ่นที่ได้รับคะแนนสูงสุดในการทดสอบการเรียกดูที่ยากลำบากทั้งในภาษาอังกฤษและภาษาจีน
ในรุ่นจีนของเกณฑ์มาตรฐาน WebSailor-72B ได้คะแนน 30.1 ในการทดสอบภาษาอังกฤษได้คะแนน 12.0 นักวิจัยยืนยันว่า“ Websailor มีประสิทธิภาพสูงกว่าตัวแทนโอเพนซอร์ซทั้งหมดในงานการค้นหาข้อมูลที่ซับซ้อนการจับคู่ประสิทธิภาพของตัวแทนที่เป็นกรรมสิทธิ์และการปิดช่องว่างความสามารถ”
Alibaba Websailor AI Agent Methodmarks กระดาษเน้นว่าโมเดล Websailor-7B ที่เรียบง่ายมีประสิทธิภาพสูงกว่าตัวแทนที่สร้างขึ้นในรุ่นที่มีขนาดใหญ่กว่า 32B ซึ่งเน้นประสิทธิภาพของกระบวนทัศน์ใหม่
ตัวแทนยังแสดงความเข้ากันได้ลดลงอย่างมาก แม้จะได้รับการฝึกฝนเกี่ยวกับปัญหาที่ยากมาก Websailor นั้นมีวิธีการอื่น ๆ ในมาตรฐาน SimpleQa ที่เรียบง่ายกว่าซึ่งแสดงให้เห็นว่าทักษะการใช้เหตุผลขั้นสูงนั้นมีความหลากหลายและไม่ประนีประนอมประสิทธิภาพพื้นฐาน
นำทางการแข่งขัน AI ของจีน มันลงจอดท่ามกลาง“ สงครามแห่งหนึ่งร้อยรุ่น” ที่ดุเดือดในประเทศจีนซึ่งยักษ์ใหญ่ด้านเทคโนโลยีกำลังเปิดการทำงานอย่างจริงจังเพื่อจับส่วนแบ่งการตลาด การเคลื่อนไหวอย่างมีกลยุทธ์วางตำแหน่งอาลีบาบาในฐานะผู้นำในการพัฒนา AI ขั้นสูง
ความตึงเครียดในการแข่งขันได้รับการเน้นเมื่อเร็ว ๆ นี้เมื่อกลุ่มวิจัยกล่าวหาว่าโมเดล Pangu ใหม่ของ Huawei เป็นสำเนาของโมเดล Qwen ของอาลีบาบา ห้องปฏิบัติการของ Huawei ออกการปฏิเสธของ บริษัท โดยระบุว่าแบบจำลองคือ“ …ไม่ได้ขึ้นอยู่กับการฝึกอบรมที่เพิ่มขึ้นของโมเดลของผู้ผลิตรายอื่น…” และพัฒนาอย่างอิสระ
ฉากหลังของการแข่งขันในประเทศที่รุนแรงนี้รวมถึงผู้เล่นรายใหญ่เช่น Baidu แรงผลักดันนี้เกิดจากแรงกดดันทางการเมืองที่กว้างขึ้นเนื่องจากการคว่ำบาตรของสหรัฐอเมริกา จำกัด การเข้าถึงฮาร์ดแวร์ระดับสูงและบังคับให้ บริษัท จีนสร้างระบบนิเวศที่พึ่งพาตนเองได้
แรงกดดันเหล่านี้ขยายเกินกว่าฮาร์ดแวร์ การเป็นหุ้นส่วนที่สำคัญต้องเผชิญกับการตรวจสอบข้อเท็จจริงระหว่างประเทศดังที่เห็นเมื่อ AI ที่มีศักยภาพของ Apple จัดการกับ Alibaba ดึงแบ็คแลชในวอชิงตันผ่านความกังวลด้านความมั่นคงของชาติ สิ่งนี้บังคับให้ยักษ์เทคโนโลยีจีนนำทางภูมิทัศน์ที่ซับซ้อนของการแข่งขันในประเทศและการเมืองระดับโลก
ความตึงเครียดในการแข่งขันได้รับการเน้นเมื่อเร็ว ๆ นี้เมื่อกลุ่มวิจัยกล่าวหาว่าโมเดล Pangu ใหม่ของ Huawei เป็นสำเนาของโมเดล Qwen ของอาลีบาบา ห้องปฏิบัติการของ Huawei ออกการปฏิเสธของ บริษัท โดยระบุว่าแบบจำลองคือ“ …ไม่ได้ขึ้นอยู่กับการฝึกอบรมที่เพิ่มขึ้นของโมเดลของผู้ผลิตรายอื่น…” และพัฒนาอย่างอิสระ
ฉากหลังของการแข่งขันในประเทศที่รุนแรงนี้รวมถึงผู้เล่นรายใหญ่เช่น Baidu แรงผลักดันนี้เกิดจากแรงกดดันทางการเมืองที่กว้างขึ้นเนื่องจากการคว่ำบาตรของสหรัฐอเมริกา จำกัด การเข้าถึงฮาร์ดแวร์ระดับสูงและบังคับให้ บริษัท จีนสร้างระบบนิเวศที่พึ่งพาตนเองได้
แรงกดดันเหล่านี้ขยายเกินกว่าฮาร์ดแวร์ การเป็นหุ้นส่วนที่สำคัญต้องเผชิญกับการตรวจสอบข้อเท็จจริงระหว่างประเทศดังที่เห็นเมื่อ AI ที่มีศักยภาพของ Apple จัดการกับ Alibaba ดึงแบ็คแลชในวอชิงตันผ่านความกังวลด้านความมั่นคงของชาติ สิ่งนี้บังคับให้ยักษ์เทคโนโลยีจีนนำทางภูมิทัศน์ที่ซับซ้อนของการแข่งขันในประเทศและการเมืองระดับโลก