AI การเปรียบเทียบแพลตฟอร์ม Chatbot Arena สร้าง บริษัท ใหม่เปิดตัว Lmarena

กลุ่มวิจัยเชิงวิชาการที่อยู่เบื้องหลัง Chatbot Arena ซึ่งเป็นแพลตฟอร์มที่ได้รับการติดตามอย่างกว้างขวางสำหรับการจัดอันดับโมเดลปัญญาประดิษฐ์ได้จัดตั้ง บริษัท ที่เป็นทางการ Arena Intelligence Inc. ซึ่งจะดำเนินการภายใต้ชื่อแบรนด์ lmarena

ตามรายละเอียดใน wei-lin chiang ข้างๆศาสตราจารย์ UC Berkeley target=”_ blank”> ion stoica ผู้ร่วมก่อตั้ง Databricks และ anyscale.

จากโครงการมหาวิทยาลัยสู่อุตสาหกรรมหลัก

เปิดตัวในช่วงต้นปี 2023 Lab คอมพิวเตอร์ โดยนักวิจัยจากหลายสถาบัน Chatbot Arena ได้รับความโดดเด่นอย่างรวดเร็วในภาค AI

มันเสนอวิธีการใหม่ในการประเมินแบบจำลองภาษาขนาดใหญ่โดยการตอบรับของมนุษย์ผ่านการเปรียบเทียบแบบตัวต่อตัว ผู้ใช้โต้ตอบกับสองรุ่นที่ไม่ระบุชื่อพร้อมกันและลงคะแนนสำหรับการตอบสนองที่ต้องการสร้างการจัดอันดับที่ใช้ ELO แบบไดนามิก (วิธีที่ใช้กันทั่วไปในการหมากรุกเพื่อให้คะแนนระดับทักษะของผู้เล่น)

ระบบนี้สร้างกระดานผู้นำสาธารณะที่มีอิทธิพล Major AI Labs เช่น Openai, Google และมานุษยวิทยาใช้แพลตฟอร์มบางครั้งถึงกับใช้เป็นพื้นที่ทดสอบสำหรับรุ่นที่ยังไม่เผยแพร่ Angelopoulos ระบุว่าวิสัยทัศน์พื้นฐานยังคงที่:“ วิสัยทัศน์ของเราคือสิ่งนี้จะยังคงเป็นสถานที่ที่ทุกคนบนอินเทอร์เน็ตสามารถมาและพยายามแชทและใช้ AI เปรียบเทียบผู้ให้บริการที่แตกต่างกันและอื่น ๆ ”

โครงการเริ่มต้นด้วยการสนับสนุนจากการบริจาคมหาวิทยาลัย href=”https://a16z.com/announcing-our-latest-open-source-ai-grants/”target=”_ blank”> Andreessen Horowitz และ AI Infrastructure Company

การเปลี่ยนแปลงขององค์กรนี้ยังเกิดขึ้นท่ามกลางการอภิปรายอย่างต่อเนื่องเกี่ยวกับวิธีการของแพลตฟอร์มและอคติที่อาจเกิดขึ้นและการตรวจสอบที่มีอยู่เกี่ยวกับวิธีการและเงินทุน การวิพากษ์วิจารณ์ที่ผ่านมามีศูนย์กลางอยู่ที่การลงคะแนนเสียงของผู้ใช้ (ได้รับอิทธิพลจากการตั้งค่าโวหารและความสามารถที่หลากหลายในการตรวจจับข้อผิดพลาด AI) การเบ้ประชากรที่อาจเกิดขึ้นจากฐานผู้ใช้ที่อยู่ห่างจากสาธารณะทั่วไปและความโปร่งใสเกี่ยวกับชุดข้อมูลเต็มรูปแบบ

การให้คำมั่นสัญญาความเป็นกลางในขณะที่ขยายขอบเขต

ทีม Lmarena ได้กล่าวถึงประเด็นสำคัญของความยุติธรรมในการประกาศโดยตรงโดยเน้นความมุ่งมั่นในการประเมินผลที่เป็นธรรม: พวกเขาตอกย้ำความเชื่อของพวกเขาว่าการจับความชอบของมนุษย์ในโลกแห่งความเป็นจริงเป็นกุญแจสำคัญในการพัฒนา AI อย่างรับผิดชอบต่อผู้ใช้และนักพัฒนาทั้งหมด

นอกเหนือจากการปรับแต่งการจัดอันดับแชทบ็อตหลัก Lmarena วางแผนการขยายกิจกรรมการประเมินที่สำคัญ แผนงานรวมถึงการสนับสนุนการสนับสนุนสำหรับการวิจัยแบบเปิดและเปิดตัวสภาพแวดล้อมการทดสอบที่เชี่ยวชาญมากขึ้น เว็บไซต์ของ บริษัท ได้แสดงโครงการที่ใช้งานอยู่เช่น WebDev Arena, Repochat Arena และเวทีการค้นหาโดยมีแผนสำหรับการแข่งขันในอนาคตที่อุทิศให้กับโมเดลวิสัยทัศน์ตัวแทน AI และแบบฝึกหัด AI Red Teaming

การระดมทุนและการดำเนินงานในอนาคต href=”https://www.bloomberg.com/news/articles/2025-04-17/popular-ai-ranking-website-chatbot-arena-is-becoming-a-real-company”เป้าหมายที่มีศักยภาพ บริษัท ยังคงพิจารณารูปแบบธุรกิจระยะยาว ความเป็นไปได้อย่างหนึ่งที่กล่าวถึงโดย Stoica ถึง Bloomberg อาจเกี่ยวข้องกับการชาร์จ บริษัท สำหรับการประเมินแบบจำลองของพวกเขาบนแพลตฟอร์ม ประสบความสำเร็จในการนำทางเส้นทางเพื่อรักษาความปลอดภัยการระดมทุนและอาจแนะนำกระแสรายได้ในขณะที่การรักษาความเป็นกลางและความน่าเชื่อถือทางวิทยาศาสตร์ของแพลตฟอร์มอย่างเข้มงวดจะเป็นศูนย์กลางของการเปลี่ยนแปลงของ Lmarena จากต้นกำเนิดทางวิชาการไปสู่กิจการการค้าที่ยั่งยืน

AI การเปรียบเทียบแพลตฟอร์ม Chatbot Arena สร้าง บริษัท ใหม่เปิดตัว Lmarena

Published by All Things Windows on April 18, 2025

จากโครงการมหาวิทยาลัยสู่อุตสาหกรรมหลัก

การให้คำมั่นสัญญาความเป็นกลางในขณะที่ขยายขอบเขต

IT Info

Bluesky เพื่อแนะนำระบบตรวจสอบสีน้ำเงินตรวจสอบ

IT Info

IT Info

Microsoft Edge Adobe PDF เปิดตัวเครื่องยนต์สำหรับธุรกิจที่ผลักดันไปปลายปี 2025

AI การเปรียบเทียบแพลตฟอร์ม Chatbot Arena สร้าง บริษัท ใหม่เปิดตัว Lmarena

Published by All Things Windows on April 18, 2025

จากโครงการมหาวิทยาลัยสู่อุตสาหกรรมหลัก

การให้คำมั่นสัญญาความเป็นกลางในขณะที่ขยายขอบเขต

Related Posts

IT Info

Bluesky เพื่อแนะนำระบบตรวจสอบสีน้ำเงินตรวจสอบ

IT Info

IT Info

Microsoft Edge Adobe PDF เปิดตัวเครื่องยนต์สำหรับธุรกิจที่ผลักดันไปปลายปี 2025