กลุ่มวิจัยเชิงวิชาการที่อยู่เบื้องหลัง Chatbot Arena ซึ่งเป็นแพลตฟอร์มที่ได้รับการติดตามอย่างกว้างขวางสำหรับการจัดอันดับโมเดลปัญญาประดิษฐ์ได้จัดตั้ง บริษัท ที่เป็นทางการ Arena Intelligence Inc. ซึ่งจะดำเนินการภายใต้ชื่อแบรนด์ lmarena

ตามรายละเอียดใน wei-lin chiang ข้างๆศาสตราจารย์ UC Berkeley target=”_ blank”> ion stoica ผู้ร่วมก่อตั้ง Databricks และ anyscale.

จากโครงการมหาวิทยาลัยสู่อุตสาหกรรมหลัก

เปิดตัวในช่วงต้นปี 2023 Lab คอมพิวเตอร์ โดยนักวิจัยจากหลายสถาบัน Chatbot Arena ได้รับความโดดเด่นอย่างรวดเร็วในภาค AI

มันเสนอวิธีการใหม่ในการประเมินแบบจำลองภาษาขนาดใหญ่โดยการตอบรับของมนุษย์ผ่านการเปรียบเทียบแบบตัวต่อตัว ผู้ใช้โต้ตอบกับสองรุ่นที่ไม่ระบุชื่อพร้อมกันและลงคะแนนสำหรับการตอบสนองที่ต้องการสร้างการจัดอันดับที่ใช้ ELO แบบไดนามิก (วิธีที่ใช้กันทั่วไปในการหมากรุกเพื่อให้คะแนนระดับทักษะของผู้เล่น)

ระบบนี้สร้างกระดานผู้นำสาธารณะที่มีอิทธิพล Major AI Labs เช่น Openai, Google และมานุษยวิทยาใช้แพลตฟอร์มบางครั้งถึงกับใช้เป็นพื้นที่ทดสอบสำหรับรุ่นที่ยังไม่เผยแพร่ Angelopoulos ระบุว่าวิสัยทัศน์พื้นฐานยังคงที่:“ วิสัยทัศน์ของเราคือสิ่งนี้จะยังคงเป็นสถานที่ที่ทุกคนบนอินเทอร์เน็ตสามารถมาและพยายามแชทและใช้ AI เปรียบเทียบผู้ให้บริการที่แตกต่างกันและอื่น ๆ ”

โครงการเริ่มต้นด้วยการสนับสนุนจากการบริจาคมหาวิทยาลัย href=”https://a16z.com/announcing-our-latest-open-source-ai-grants/”target=”_ blank”> Andreessen Horowitz และ AI Infrastructure Company

การเปลี่ยนแปลงขององค์กรนี้ยังเกิดขึ้นท่ามกลางการอภิปรายอย่างต่อเนื่องเกี่ยวกับวิธีการของแพลตฟอร์มและอคติที่อาจเกิดขึ้นและการตรวจสอบที่มีอยู่เกี่ยวกับวิธีการและเงินทุน การวิพากษ์วิจารณ์ที่ผ่านมามีศูนย์กลางอยู่ที่การลงคะแนนเสียงของผู้ใช้ (ได้รับอิทธิพลจากการตั้งค่าโวหารและความสามารถที่หลากหลายในการตรวจจับข้อผิดพลาด AI) การเบ้ประชากรที่อาจเกิดขึ้นจากฐานผู้ใช้ที่อยู่ห่างจากสาธารณะทั่วไปและความโปร่งใสเกี่ยวกับชุดข้อมูลเต็มรูปแบบ

การให้คำมั่นสัญญาความเป็นกลางในขณะที่ขยายขอบเขต

ทีม Lmarena ได้กล่าวถึงประเด็นสำคัญของความยุติธรรมในการประกาศโดยตรงโดยเน้นความมุ่งมั่นในการประเมินผลที่เป็นธรรม: พวกเขาตอกย้ำความเชื่อของพวกเขาว่าการจับความชอบของมนุษย์ในโลกแห่งความเป็นจริงเป็นกุญแจสำคัญในการพัฒนา AI อย่างรับผิดชอบต่อผู้ใช้และนักพัฒนาทั้งหมด

นอกเหนือจากการปรับแต่งการจัดอันดับแชทบ็อตหลัก Lmarena วางแผนการขยายกิจกรรมการประเมินที่สำคัญ แผนงานรวมถึงการสนับสนุนการสนับสนุนสำหรับการวิจัยแบบเปิดและเปิดตัวสภาพแวดล้อมการทดสอบที่เชี่ยวชาญมากขึ้น เว็บไซต์ของ บริษัท ได้แสดงโครงการที่ใช้งานอยู่เช่น WebDev Arena, Repochat Arena และเวทีการค้นหาโดยมีแผนสำหรับการแข่งขันในอนาคตที่อุทิศให้กับโมเดลวิสัยทัศน์ตัวแทน AI และแบบฝึกหัด AI Red Teaming

การระดมทุนและการดำเนินงานในอนาคต href=”https://www.bloomberg.com/news/articles/2025-04-17/popular-ai-ranking-website-chatbot-arena-is-becoming-a-real-company”เป้าหมายที่มีศักยภาพ บริษัท ยังคงพิจารณารูปแบบธุรกิจระยะยาว ความเป็นไปได้อย่างหนึ่งที่กล่าวถึงโดย Stoica ถึง Bloomberg อาจเกี่ยวข้องกับการชาร์จ บริษัท สำหรับการประเมินแบบจำลองของพวกเขาบนแพลตฟอร์ม ประสบความสำเร็จในการนำทางเส้นทางเพื่อรักษาความปลอดภัยการระดมทุนและอาจแนะนำกระแสรายได้ในขณะที่การรักษาความเป็นกลางและความน่าเชื่อถือทางวิทยาศาสตร์ของแพลตฟอร์มอย่างเข้มงวดจะเป็นศูนย์กลางของการเปลี่ยนแปลงของ Lmarena จากต้นกำเนิดทางวิชาการไปสู่กิจการการค้าที่ยั่งยืน