Elon Musks XAI har ökat i AI Arms-loppet mot rival OpenAI. Den 10 augusti gjorde Xai sin Grok 4-modell gratis för alla användare över hela världen under en begränsad tid. Flytten är en direkt utmaning för Openais egen flaggskeppsmodell, GPT-5, som lanserades bara några dagar tidigare till en stenig offentlig debut.
Denna höga insatser för användare kommer när båda företagen står inför skarp kritik. OpenAI hanterar rapporter om buggar och fel i GPT-5. Samtidigt står XAI inför pågående säkerhetsfrågor, inklusive dess Grok Imagine-verktyg som skapar DeepFake-innehåll. Duelleringslanseringen belyser en kärnindustrins spänning.
En berättelse om två lanseringar: OpenAI STUMBLES, XAI POUNCES
OpenAI avslöjade GPT-5 den 7 augusti, och lovade en smartare, snabbare och mer tillförlitlig modell. Lanseringen introducerade en enhetlig arkitektur utformad för att eliminera vad VD Sam Altman tidigare hade kallat en”mycket förvirrande röra.”Den använder en realtidsrouter för att automatiskt välja den bästa interna modellen för en given uppgift.
imponerande benchmark är resultatet från dess officiella systemkort
Lanseringen, dock snabbt. Användare på sociala medier dokumenterade en kaskad av bisarra buggar och faktiska fel. Modellen producerade kartor med fiktiva statliga namn som”OneGon”och”Gelahbrin”, misslyckades med grundläggande matematikproblem och uppfann fiktiva amerikanska presidenter, vilket ledde till utbredd löjning.
Möt president William H. Brusen från Great State of OneGon https://t.co/CYBzo7R03S pic.twitter.com/eMfxnMNr2r
— Eric Vanderburg (@evanderburg) 8 augusti, 2025
en informell poll-fundna rest rest REST REST REMALLA REMALLA MELLA MIDEL ASMAL”. Den offentliga mottagningen var överväldigande negativ, en skarp kontrast till företagets ambitiösa påståenden. På prediktionsmarknadspolymarketen kollapsade oddsen för OpenAI med den bästa modellen i slutet av månaden från 75% till bara 14% på en timme. Sedan dess återvann oddsen endast något till cirka 22% i skrivande stund.
Bakstället var så allvarligt att senast i augusti utfärdade Altman en offentlig ursäkt. Han medgav att en felaktig”autoswitcher”mellan modellens interna lägen hade gjort det under en längre tid”verkar vara dumare”än avsett. I en betydande reversering lovade OpenAI att återställa åtkomsten till sin populära föregångare, GPT-4O.
GPT-5 utrullningsuppdateringar:
*Vi kommer att låta PLUS-användare kommer att använda 4O. Vi kommer att titta på användning när vi tänker på hur länge vi ska erbjuda äldre modeller för.
*GPT-5 kommer att verka smartare start…
-Sam Altman (@sama) 8 augusti 2025
Den felaktiga utrullningen av GPT-5 har gett ammunition för kritiker som hävdar att branschens”skalning”-strategi träffar en mur. AI-forskaren Gary Marcus, en lång tid skeptiker med nuvarande metoder, sade:”Ingen med intellektuell integritet kan fortfarande tro att ren skalning kommer att få oss till AGI.”
Felen var inte mindre fel men grundläggande misslyckanden. För en modell som OpenAI hade arbetat med sedan slutet av 2023 var misstagen särskilt pinsamma. Händelsen tvingade företaget till en defensiv hållning, en sällsynt position för branschledaren.
Mitt arbete här är verkligen gjort. Ingen med intellektuell integritet kan fortfarande tro att ren skalning kommer att få oss till AGI.
GPT-5 kan vara en måttlig kvantitativ förbättring (och det kan vara billigare) men det misslyckas fortfarande på alla samma kvalitativa sätt som sina föregångare, på chess, på…
-Gary Marcus (@ggarymar) href=”https://twitter.com/garyMarcus/status/1953939152594252170?ref_src=twsrc%5etfw”Target=”_ blank”> 8 augusti 2025
Just Twoids senare senare, xi SED. Den 10 augusti tillkännagav Xai att Grok 4 nu var gratis för alla användare över hela världen under en begränsad tid. Flytten var ett tydligt strategiskt svar på Openais snubbla och syftar till att fånga desillusionerade användare med ett kraftfullt alternativ som också har ett automatiskt routingsystem.
grok 4 är nu gratis för alla användare över hela världen!
Använd bara auto-läge, och grok kommer att rutt komplexa frågeställningar till grok 4. Föredra kontrollen? Välj”Expert”när som helst för att alltid använda grok 4.
Under en begränsad tid rullar vi ut generösa användningsgränser så att du kan utforska grok 4: s fulla… pic.twitter.com/vw1pn3iv href=”https://twitter.com/xai/status/1954573454214418820?ref_src=twsrc%5etfw”Target=”_ blank”> 10 augusti 2025
Medan XAI kapitaliserade på OpenAI: s misstag, plågas sina egna produkter av allvarliga etiska och säkerhetsproblem. Den fria frisläppandet av Grok 4 sammanfaller med främjandet av Grok Imagine, ett videoutgångsverktyg som redan har använts för att skapa skadligt innehåll.
Bara några dagar före den fria lanseringen, avslöjade rapporter hur Grok Imague’s så kallade”Spicy”-läge lätt kunde generera icke-konsensual Deepfake Nudes of Celebrites som Taylor Swift. Modellen fängslades också snabbt av säkerhetsforskare, och interna projekt som”Skippy”, som använde anställdas ansiktsdata för utbildning, utlöste motreaktion över integritetsproblem.
Ett vapenkapp som definieras av Flaws
XAI: s strategi verkar för att prioritera benchmark-prestanda över verkliga. Despite Musk’s claim that “with respect to academic questions, Grok 4 is better than PhD level in every subject, no exceptions,” user-preference platforms tell a different story.
Yupp.ai co-founder Jimmy Lin found that “Grok 4 is worse than other leading models: OpenAI o3, Claude Opus 4, and Gemini 2.5 Pro. Grok 4 is liked even less than Grok 3.”, suggesting the model was”Överfylld”till ACE-test.
Detta fokus på mätvärden är en del av ett bredare”benchmark-krig.”Läckta dokument avslöjade XAI anställda entreprenörer specifikt för att slå Anthropic’s Claude på kodningslistor. Kritiker som Sara Hooker, chef för Cohere Labs, hävdar att”när en topplista är viktig för ett helt ekosystem, är incitamenten i linje för att det ska spelas.”
Dueling, oroliga lanseringar från branschens toppspelare avslöjar en svår sanning. Det obevekliga trycket för att förnya och dominera är att skjuta modeller ut genom dörren innan de verkligen är redo. För användare betyder detta att navigera i ett landskap av kraftfulla men djupt felaktiga verktyg.