The academic research group behind Chatbot Arena, the widely followed platform for ranking artificial intelligence models, has established a formal company, Arena Intelligence Inc., which will operate under the brand name LMArena.

As detailed in an official Företagets blogginlägg På torsdagen är flytten avsedd att säkra den nödvändiga finansieringen och strukturen för betydande plattformsuppgraderingar och accelererad tillväxt.

Företaget leds av nyckelfigurer från dess akademiska ursprung, inklusive nyligen UC Berkeley Postdoctoral-forskare wei-lin chiang , tillsammans med uc Berkeley professor och anmärkningsvärt tech entrepreneur jon stoica , en av grundare av databricks och allscale.

från universitetsprojekt till bransch stapel

lanserade i början av 2023 från UC Berkeley’s

Detta system skapade en offentlig topplista som blev inflytelserik och lockade snabbt en miljon besökare varje månad. Stora AI-laboratorier som OpenAI, Google och Anthropic använder plattformen, ibland till och med använder den som en testplats för outgivna modeller. Angelopoulos uppgav att den underliggande visionen förblir konstant:”Vår vision är att detta kommer att förbli en plats där alla på internet kan komma och försöka chatta och använda AI, jämföra olika leverantörer och så vidare.”

Projektet som ursprungligen opererade med stöd från universitetsbidrag och donationer från organisationer inklusive Googles Kaggle-plattform, venture Capital andreessen horowitz och ai infrastructure company beta.lmarena.ai, rebuilt, according to the announcement, to enhance speed, improve the mobile experience, och erbjuda tydligare omröstningsalternativ baserade på samhällsinput. Framtida plattformsuppgraderingar är planerade för att inkludera användarkonton, chatthistorikbesparing och skapandet av personliga topplistor.

Denna organisatoriska förändring sker också mitt i pågående diskussion om plattformens metodik och potentiella fördomar och befintlig granskning av dess metoder och finansiering. Tidigare kritiker centrerade på subjektiviteten för användarröster (påverkade av stilistiska preferenser och varierande förmågor för att upptäcka AI-fel), potentiella demografiska skevning av användarbasen från allmänheten från allmänheten och transparens när det gäller hela datamodellerna.

pantsatt neutralitet medan han utvidgade räckvidden

LMARENA-teamet behandlade direkt den avgörande frågan om rättvisa i deras tillkännagivande, betonar ett engagemang för impartial utvärdering: “Vårt topplista kommer aldrig att vara partisk mot (eller mot) någon leverantör och kommer att betona vårt samhälle som kommer att vara konstruktion. Det kommer att vara vetenskap. De underströk sin tro på att fånga äkta, verkliga mänskliga preferenser är nyckeln till att främja AI ansvarsfullt för alla användare och utvecklare.

Utöver förädling av Chatbot-rankingen, planerar LMarena en betydande utvidgning av dess utvärderingsaktiviteter. Roadmap inkluderar stärkande stöd för öppen forskning och lansering av mer specialiserade testmiljöer. The company’s website already lists active projects like WebDev Arena, RepoChat Arena, and Search Arena, with plans for future arenas dedicated to vision models, AI agents, and AI red-teaming exercises.

Funding and Future Operations

While Arena Intelligence Inc. intends för att samla in venture capital för att stödja dess tillväxt och plattformsutveckling, om specifika investerare eller funnelser har inte varit att dela. Företaget bestämmer fortfarande sin långsiktiga affärsmodell. En möjlighet, som nämns av Stoica till Bloomberg, kan involvera laddningsföretag för att utvärdera sina modeller på plattformen. Framgångsrikt navigera på vägen för att säkra finansiering och potentiellt införa intäktsströmmar, samtidigt som de upprätthåller plattformens neutralitet och vetenskapliga trovärdighet noggrant, kommer att vara centralt för LMarenas övergång från dess akademiska ursprung till en hållbar kommersiell enhet.

Categories: IT Info