Xai van Elon Musk is opgevoerd in de AI-wapenwedloop tegen rivaal Openai. Op 10 augustus maakte Xai zijn GROK 4-model gratis voor alle gebruikers over de hele wereld voor een beperkte tijd. De verhuizing is een directe uitdaging voor het eigen vlaggenschipmodel van Openai, GPT-5, dat slechts enkele dagen eerder werd gelanceerd voor een Rocky Public Debut. OpenAI pakt meldingen van bugs en fouten in GPT-5 aan. Ondertussen wordt Xai geconfronteerd met voortdurende veiligheidsproblemen, waaronder de GROK Imagine-tool die deepfake-inhoud creëert. Het duelleren lanceert een kernindustriespanning.
Een verhaal over twee lanceringen: Openai Stumbles, Xai Pounces
Openai onthulde GPT-5 op 7 augustus, beloofde een slimmer, sneller en betrouwbaarder model. De lancering introduceerde een uniforme architectuur die was ontworpen om te elimineren wat CEO Sam Altman eerder een’zeer verwarrende puinhoop’had genoemd. Het maakt gebruik van een realtime router om automatisch het beste interne model voor een bepaalde taak te selecteren.
Voor de meeste queries is het op een efficiënt base-model gebaseerd op een efficiënte basismodel `gpt-5-main`. Voor meer complexe problemen schakelt het over naar een dieper redeneermodel, `GPT-5-Thinking` {{U01}}. Voor het eerst stelde Openai deze topcapaciteiten beschikbaar voor gratis gebruikers, een belangrijke strategische verschuiving gericht op het democratiseren van toegang tot state-of-the-art AI.
Het bedrijf steunde zijn claims met Impressieve benchmark resultaten van het officiële systeemkaartje . CEO Sam Altman verklaarde vol vertrouwen:”Dit is het beste model ter wereld bij het coderen… het beste model ter wereld bij het schrijven, het beste model ter wereld bij de gezondheidszorg, en een lange lijst met dingen daarachter.”
De lancering is echter snel ontrafeld. Gebruikers op sociale media documenteerden een cascade van bizarre bugs en feitelijke fouten. Het model produceerde kaarten met fictieve staatsnamen als”OneGon”en”Gelahbrin”, mislukte bij fundamentele wiskundeproblemen en vond fictieve Amerikaanse presidenten uitgevonden, wat leidde tot wijdverbreide spot.
ontmoet president William H. Brusen van de grote staat target=”_blank”> https://t.co/cybzo7r03s pic.twitter.com/emfxnmnr2r
-eric vanderburg) href=”https://twitter.com/evanderburg/status/1953897138431443196?ref_src=twsrc%5Etfw” target=”_blank”>August 8, 2025
An informal poll found most users rating the model as simply “Kinda mid.”De openbare receptie was overweldigend negatief, een schril contrast met de ambitieuze claims van het bedrijf. Op de Polymarket van de voorspellingsmarkt stortte de kans dat Openai tegen het einde van de maand het beste model had, van 75% tot slechts 14% in één uur. Sindsdien hebben de kansen op het moment van schrijven slechts iets herleend tot ongeveer 22%. Hij gaf toe dat een defecte”autoswitcher”tussen de interne modi van het model het voor een langere tijd”veel dommer leken”had gemaakt dan bedoeld. In een aanzienlijke omkering beloofde OpenAI de toegang tot zijn populaire voorganger, GPT-4O.
GPT-5 Rollout-updates te herstellen:
*We gaan naar Dubbel GPT-5 Rate Limits voor chatgpt plus gebruikers als we uitrollen.
* We zullen het gebruik bekijken als we nadenken over hoe lang we legacy-modellen voor aanbieden.
*GPT-5 zal slimmer beginnen te starten…
-Sam Altman (@sama) 8 augustus 2025
De gebrekkige uitrol van GPT-5 heeft munitie verstrekt voor critici die beweren dat de”schaal”-benadering van de industrie een muur raakt. AI-onderzoeker Gary Marcus, een oude scepticus van de huidige methoden, verklaarde:”Niemand met intellectuele integriteit kan nog steeds geloven dat pure schaalverdeling ons naar Agi zal brengen.”
De fouten waren geen kleine glitches maar fundamentele mislukkingen. Voor een model waaraan Openai sinds eind 2023 had gewerkt, waren de fouten bijzonder beschamend. Het incident dwong het bedrijf in een verdedigende houding, een zeldzame positie voor de marktleider.
Mijn werk hier is echt klaar. Niemand met een intellectuele integriteit kan nog steeds geloven dat pure schaling ons naar Agi zal brengen.
GPT-5 kan een gematigde kwantitatieve verbetering zijn (en het kan goedkoper zijn) maar het faalt nog steeds op dezelfde kwalitatieve manieren als zijn voorgangers, op schaken, op…
-Gary Marcus (@garymarcus) href=”https://twitter.com/GaryMarcus/status/1953939152594252170?ref_src=twsrc%5Etfw” target=”_blank”>August 8, 2025
Just two days later, xAI seized the moment. Op 10 augustus kondigde Xai aan dat Grok 4 nu voor alle gebruikers wereldwijd gratis was voor alle gebruikers. De verhuizing was een duidelijke strategische reactie op het struikelen van Openai, gericht op het vangen van gedesillusioneerde gebruikers met een krachtig alternatief dat ook een automatisch routeringssysteem heeft.
GROK 4 is nu gratis voor alle gebruikers wereldwijd!
Gebruik gewoon de Auto-modus en GROK zal complexe vragen naar Grek 4. Kies”Expert”altijd om altijd GROK 4 te gebruiken.
Voor een beperkte tijd rollen we genereuze gebruikslimieten uit, zodat u GROK 4’s volledige… pic.twitter.com/vw1pn3ivke
-xa
-xa
-xa
-@a @xaI) August 10, 2025
Grok’s Free-for-All Gambit Masks Deeper Kwesties
Terwijl XAI gebruikte van de misstap van Openai, worden zijn eigen producten geplaagd door ernstige ethische en veiligheidsproblemen. De gratis release van GROK 4 valt samen met de promotie van GROK Imagine, een tool voor het genereren van video’s die al is gebruikt om schadelijke inhoud te creëren.
Slechts enkele dagen voor de gratis lancering onthulden rapporten hoe Grok Imagine’s zogenaamde”Spicy”-modus gemakkelijk niet-consensuele Deepfee-naakts van beroemdheden als Taylor Swift kan genereren. Het model werd ook snel jailbroken door beveiligingsonderzoekers, en interne projecten zoals”Skippy”, die gezichtsgegevens voor werknemers gebruikten voor training, leidde tot terugslag over privacyproblemen.
een wapenwapens die zijn gedefinieerd door fouten
XAI’s strategie lijkt prioriteit te geven aan benchmarkprestaties over reële hulpprogramma’s. Ondanks de bewering van Musk dat”met betrekking tot academische vragen, GROK 4 beter is dan promovendus in elk onderwerp, geen uitzonderingen,”vertellen gebruikerspreferentieplatforms een ander verhaal.
yupp.ai mede-oprichter Jimmy Lin Jimmy Lin heeft gevonden dat”GROK 4 slechter is dan andere toonaangevende modellen: OpenAi O3, CLAUDE OPUS 4, CLAUDE OPUS 4, CLAUDE OPUS 4, CLAUDE OPUS 4, CLAUDE OPUS 4, CLAUDE OPUS 4, en GEMINI 2,5 PROO-Pro.”Overgeplaatst”aan aas tests.
Deze focus op metrieken maakt deel uit van een bredere”benchmarkoorlog”. Lekte documenten onthulden Xai aangenomen aannemers specifiek om de claude van Anthropic te verslaan op coderende leaderboards. Critici zoals Sara Hooker, hoofd van CoHere Labs, beweren dat”wanneer een klassement belangrijk is voor een heel ecosysteem, de prikkels zijn afgestemd op het gamed.”
De duellerende, onrustige lanceringen van de topspelers van de industrie onthullen een moeilijke waarheid. De meedogenloze druk om te innoveren en te domineren is het duwen van modellen de deur uit voordat ze echt klaar zijn. Voor gebruikers betekent dit navigeren door een landschap van krachtige maar diep gebrekkige tools.