LMArena, a startup spun out from UC Berkeley’s influential Chatbot Arena project, has secured $100 million in seed funding, propelling its valuation to a reported $600 million.
The funding round is led by Andreessen Horowitz and UC Investments, with notable participation from Lightspeed Venture Partners, Felicis Ventures, Kleiner Perkins, Laude Ventures, and The Dana rumah. Infus modal bertujuan untuk mengkomersialkan dan secara signifikan memperluas platform evaluasi model AI.
Pengembangan ini menggarisbawahi semakin pentingnya dan dukungan keuangan alat yang dirancang untuk menilai kemampuan kecerdasan buatan, menawarkan wawasan penting bagi pengembang dan industri. Balap untuk membangun model yang semakin besar, pertanyaan sulit tidak lagi apa yang bisa dilakukan AI. Platform telah membuat tanda, dengan lebih dari empat ratus evaluasi model dan lebih dari tiga juta suara yang dipengaruhi, memengaruhi model dari raksasa teknologi seperti Google, OpenAi, Meta, dan XAI. Ion Stoica, Co-Founder Lmarena dan Profesor UC Berkeley, menekankan peran platform, menyatakan,”Evaluasi AI sering tertinggal di balik pengembangan model. Lmarena menutup kesenjangan dengan menempatkan sains yang kuat dan berbasis di tengah-tengah. Venture
Arena chatbot awalnya muncul pada awal 2023 dari UC Berkeley’s Sky Computing Lab . Metode inovatifnya melibatkan pengguna membandingkan output secara membabi buta dari dua model AI anonim, dengan suara menghasilkan peringkat melalui sistem peringkat ELO. Pendekatan ini dengan cepat menjadikan papan peringkat publiknya sebagai sumber daya yang berpengaruh.
Transisi ke perusahaan formal, Arena Intelligence Inc., yang beroperasi sebagai Lmarena, dimaksudkan untuk mengamankan sumber daya untuk peningkatan yang signifikan. The leadership includes recent UC Berkeley postdoctoral researchers Anastasios Angelopoulos and Wei-Lin Chiang, alongside Professor Stoica, a co-founder of Databricks and Anyscale.
Prior to this seed round, the project received support from university grants and donations from entities including Google’s Kaggle, Andreessen Horowitz via its Open-Source AI hibah , dan perusahaan infrastruktur AI versi beta dari situs web lmarena juga diluncurkan untuk meningkatkan pengalaman pengguna.
menavigasi navigasi crowking
meskipun ada banyak pengaruh, LMARSI, LMARCE
dan spesialis etika. Kekhawatiran utama adalah apakah mekanisme pemungutan suara seperti itu benar-benar menangkap kualitas model yang bermakna. Emily Bender, seorang profesor linguistik Universitas Washington, menyuarakan skeptisisme untuk TechCrunch, menegaskan, “untuk menjadi valid, sebuah tolok ukur yang perlu diukur dengan baik, dan itu perlu membuat validitas yang dibangun-yaitu, harus ada bukti bahwa konstruk yang dibutuhkan untuk mengukur bahwa bunga yang spesifik, dan perlu memiliki validitas yang membangun-yaitu, harus ada bukti bahwa konstruk yang akan diukur. Dia lebih lanjut berkomentar,”Chatbot Arena belum menunjukkan bahwa memilih untuk satu output atas yang lain benar-benar berkorelasi dengan preferensi, namun mereka mungkin didefinisikan.” Kritik juga khawatir tentang potensi salah tafsir hasil, dengan asmelash Teka Hadgu dari Lesi yang menyarankan kepada TechCrunch yang mungkin digunakan laboratorium ini untuk menggunakan platform ini untuk mengklaim. Kekhawatiran ini diamplifikasi oleh kontroversi seperti Meta Llama 4 Maverick Model Meta, di mana, seperti yang dilaporkan TechCrunch, perusahaan membandingkan versi yang disetel khusus yang mengungguli standar yang kemudian dirilis. T Dia mengandalkan kontribusi pengguna yang belum dibayar juga telah menarik pengawasan etis; Kristine Gloria, sebelumnya dari Institut Aspen, mengatakan kepada TechCrunch bahwa tolok ukur seperti itu”tidak boleh menjadi satu-satunya metrik untuk evaluasi.”Matt Frederikson dari Grey Swan Ai setuju bahwa tolok ukur publik”bukan pengganti”untuk pengujian internal yang ketat dan menyarankan komunikasi yang jelas dari pengembang dan pencipta benchmark. Tim lmarena secara aktif mengatasi masalah ini. Salah satu pendiri Wei-Lin Chiang mengatakan kepada TechCrunch,”Komunitas kami tidak ada di sini sebagai sukarelawan atau penguji model.”Dia menjelaskan bahwa pengguna terlibat dengan Lmarena untuk lingkungannya yang terbuka dan transparan untuk interaksi AI dan umpan balik kolektif. Perusahaan telah secara terbuka menyatakan komitmennya terhadap keadilan dalam
Melihat ke depan, Lmarena bermaksud untuk memperluas kegiatan evaluasinya secara signifikan. Paket termasuk meningkatkan dukungan untuk penelitian terbuka dan memperkenalkan arena pengujian khusus seperti Webdev Arena, Repochat Arena, dan pencarian arena. Proyek masa depan akan menargetkan model visi, agen AI, dan latihan tim merah AI. Regarding its business model, Ion Stoica indicated to Bloomberg that one potential avenue involves charging companies for model evaluations on the platform. Komitmen terhadap netralitas dan roadmap di masa depan