Il gruppo di ricerca accademica dietro Chatbot Arena, la piattaforma ampiamente seguita per la classifica dei modelli di intelligenza artificiale, ha istituito una società formale, Arena Intelligence Inc., che opererà con il marchio Lmarena.
come dettagliato in un href=”href=”https://lmarena.ai/blog/2025-04-17-lmarena-fanys/”Target=”_ blank”> Post sul blog della società ufficiale Giovedì, la mossa ha lo scopo di garantire il finanziamento e la struttura necessari per significativi aggiornamenti della piattaforma e crescita accelerata.
L’impresa è guidata da cifre chiave delle sue origini accademiche, inclusi i recenti ricercatori post-dottoratori anastasios angelopoulos e wei-lin chiang , insieme a UC Berkeley Professor e notevole imprenditore tecnologico ion stoica , un co-fondatore di databricks e ogni scala. href=”https://sky.cs.berkeley.edu/”target=”_ blank”> Sky Computing Lab Da ricercatori di più istituzioni, Chatbot Arena ha rapidamente guadagnato importanza nel settore dell’IA. Gli utenti interagiscono con due modelli anonimi contemporaneamente e votano per la risposta preferita, generando classifiche dinamiche basate su ELO (un metodo comunemente usato negli scacchi per valutare i livelli di abilità dei giocatori).
Questo sistema ha creato una classifica pubblica che è diventata influente, attirando rapidamente un milione di visitatori mensili. I principali laboratori di intelligenza artificiale come Openai, Google e Antropico utilizzano la piattaforma, a volte anche utilizzandola come terreno di test per i modelli inediti. Angelopoulos ha dichiarato che la visione sottostante rimane costante:”La nostra visione è che questo rimarrà un luogo in cui tutti su Internet possono venire e provare a chattare e usare l’IA, confrontare diversi provider e così via.”
Il progetto inizialmente operava con il supporto delle sovvenzioni universitarie e le donazioni di organizzazioni tra cui Google Kaggle Platform, Venture Capital Andreessen Horowitz e AI Infrastructure Company Affrontare la scala e il controllo
La formazione di Arena Intelligence Inc. arriva mentre la piattaforma si prepara con le esigenze operative della sua popolarità. Il team ha dichiarato che”diventare un’azienda ci darà le risorse per migliorare in modo significativo Lmarena rispetto a quello che è oggi.” in coincidenza con questo, un nuovo sito Web beta lanciato su beta.lmarena.ai Questo spostamento organizzativo si verifica anche tra le discussioni in corso sulla metodologia della piattaforma e i potenziali pregiudizi e il controllo esistente per quanto riguarda i suoi metodi e finanziamenti. Critiche passate incentrate sulla soggettività dei voti degli utenti (influenzate dalle preferenze stilistiche e dalle varie capacità di rilevare errori di intelligenza artificiale), potenziale inclinazione demografica della base degli utenti lontano dal pubblico in generale e trasparenza per il set di set-so-So-source. Il team di LMarena ha affrontato direttamente la questione cruciale dell’equità nel loro annuncio, sottolineando un impegno per la valutazione imparziale:”La nostra classifica non sarà mai distorta verso (o contro) qualsiasi fornitore e la farà fedele rifletterà la nostra comunità. Hanno sottolineato la loro convinzione che catturare le preferenze umane autentiche e reali sia la chiave per far avanzare l’IA in modo responsabile per tutti gli utenti e gli sviluppatori. Oltre a perfezionare le principali classifiche di chatbot, Lmarena pianifica una significativa espansione delle sue attività di valutazione. La tabella di marcia include il sostegno al rafforzamento della ricerca aperta e del lancio di ambienti di test più specializzati. Il sito Web dell’azienda elenca già progetti attivi come WebDev Arena, Repochat Arena e Search Arena, con piani per future arene dedicate ai modelli di visione, agenti di intelligenza artificiale ed esercizi di AI Red-Teaming. href=”https://www.bloomberg.com/news/articles/2025-04-17/popular-ai–anking-website-chatbot-arena-is-becoming-a-real-company”bersaglio=”_ blank”> per aumentare la capitale di rischio impegnando la neutralità durante l’espansione dell’ambito