XAI di Elon Musk ha intensificato la corsa agli armamenti AI contro il rivale Openi. Il 10 agosto, Xai ha reso il suo modello Grok 4 gratuito per tutti gli utenti di tutto il mondo per un tempo limitato. La mossa è una sfida diretta per il modello di punta di Openi, GPT-5, che è stato lanciato pochi giorni prima a un debutto pubblico roccioso.

Questa battaglia ad alto contenuto di poste per gli utenti arriva mentre entrambe le aziende affrontano critiche acute. Openi sta affrontando i rapporti di bug ed errori in GPT-5. Nel frattempo, Xai affronta problemi di sicurezza in corso, incluso il suo strumento Grok Image che crea contenuti DeepFake. I lanci di duellanti evidenziano una tensione del settore principale.

Una storia di due lanci: Openai Stumples, Xai Pounces

Opens ha svelato GPT-5 il 7 agosto, promettendo un modello più susce di più, più veloce e più affidabile. Il lancio ha introdotto un’architettura unificata progettata per eliminare ciò che il CEO Sam Altman aveva precedentemente definito un”pasticcio molto confuso”. Utilizza un router in tempo reale per selezionare automaticamente il miglior modello interno per un determinato compito.

Per la maggior parte delle query, si basa su un modello base efficiente chiamato `GPT-5-Main`. Per problemi più complessi, passa a un modello di ragionamento più profondo, `GPT-5-pensiero` {{u01}}. Per la prima volta, Openai ha reso disponibili queste capacità di alto livello per gli utenti gratuiti, un grande cambiamento strategico volto a democratizzare l’accesso all’intelligenza artificiale all’avanguardia.

La società ha sostenuto le sue affermazioni con Imparect Callmark risulta dal suo scheda ufficiale . Il CEO Sam Altman ha dichiarato con sicurezza:”Questo è il miglior modello al mondo nella codifica… il miglior modello al mondo a scrivere, il miglior modello al mondo in assistenza sanitaria e una lunga lista di cose oltre a ciò.”

Il lancio, tuttavia, si è rapidamente svelato. Gli utenti sui social media hanno documentato una cascata di bug bizzarri ed errori fattuali. Il modello ha prodotto mappe con nomi di stato immaginario come”Onegon”e”Gelahbrin”, fallito nei problemi di matematica di base, e ha inventato presidenti statunitensi immaginari, portando a un ridicolo diffuso.

Incontra il presidente William H. Brusen dal grande stato di Onegon https://t.co/cybzo7r03s pic.twitter.com/emfxnmnr2r

-Eric Vanderg) href=”https://twitter.com/evanderburg/status/1953897138431443196?ref_src=twsrc%5etfw”_ blank”> 8 agosto 2025

un sondaggio informale trovato il modello come modello”kind.”L’accoglienza pubblica è stata straordinariamente negativa, un netto contrasto con le ambiziose affermazioni dell’azienda. Sul polimarket del mercato delle previsioni, le probabilità di Openi che hanno il miglior modello entro la fine del mese sono crollate dal 75% al 14% in una sola ora. Da allora, le probabilità sono state revocate solo leggermente a circa il 22% al momento della stesura. Ha ammesso un”Autoswitcher”difettoso tra le modalità interne del modello che lo aveva reso per un tempo più lungo di”sembrare più stupido”del previsto. In una significativa inversione, Openai ha promesso di ripristinare l’accesso al suo popolare predecessore, GPT-4o.

GPT-5 Aggiornamenti di lancio:

*Doppetteremo i limiti di tasso GPT-5 per GHEGT più gli utenti mentre finiremo il lancio.

**Ploremo che gli utenti scelgheremo di usare 4o. Guarderemo l’utilizzo mentre pensiamo a quanto tempo offrire i modelli legacy per.

*GPT-5 sembrerà più intelligente a partire da…

-Sam Altman (@sama)

Gli errori non erano piccoli problemi ma fallimenti fondamentali. Per un modello su cui Openai aveva lavorato dalla fine del 2023, gli errori erano particolarmente imbarazzanti. L’incidente ha costretto l’azienda a una postura difensiva, una posizione rara per il leader del settore.

Il mio lavoro qui è davvero fatto. Nessuno con integrità intellettuale può ancora credere che il puro ridimensionamento ci porterà ad Agi.

GPT-5 può essere un moderato miglioramento quantitativo (e può essere più economico) ma non riesce ancora allo stesso modo qualitativo dei suoi predecessori, su scacchi, su…

-Gary Marcus (@Garymarcus) 8 agosto 2025

solo due giorni più tardi, xiaized il momento. Il 10 agosto, Xai ha annunciato che Grok 4 era ora gratuito per tutti gli utenti in tutto il mondo per un tempo limitato. La mossa è stata una chiara risposta strategica allo Stumble di Openi, con l’obiettivo di catturare utenti disillusi con una potente alternativa che presenta anche un sistema di routing automatico.

Grok 4 è ora gratuito per tutti gli utenti in tutto il mondo!

Usa semplicemente la modalità automatica e Grok percorrerà le domande complesse per Grok 4. Preferire il controllo? Scegli”Expert”in qualsiasi momento per usare sempre Grok 4.

Per un tempo limitato, stiamo lanciando generosi limiti di utilizzo in modo da poter esplorare il pieno di Grok 4… pic.twitter.com/vw1pn3ivke

href=”https://twitter.com/xai/status/1954573454214418820?ref_src=twsrc%5etfw”_ blank”> 10 agosto, 2025

fuor gambi-wor-tutto-a tutto il gioco Problemi

Mentre Xai ha capitalizzato sul passo falso di Openi, i suoi prodotti sono afflitti da gravi problemi etici e di sicurezza. Il rilascio gratuito di Grok 4 coincide con la promozione di Grok Imagine, uno strumento di generazione di video che è già stato utilizzato per creare contenuti dannosi.

pochi giorni prima del lancio libero, i rapporti hanno rivelato come la cosiddetta modalità”piccante”di Grok Image potrebbe facilmente generare nudes non consensuali di celebrità come Taylor Swift. Il modello è stato anche rapidamente jailbreak da ricercatori di sicurezza e progetti interni come”Skippy”, che utilizzava i dati facciali per i dipendenti per la formazione, ha suscitato contraccolpo sulle preoccupazioni sulla privacy.

Una gara d’arma definita dai difetti

la strategia di Xai sembra dare priorità alla performance di riferimento per il reico urilità. Nonostante l’affermazione di Musk secondo cui”per quanto riguarda le domande accademiche, Grok 4 è migliore del livello di dottorato in ogni argomento, nessuna eccezione”, le piattaforme di preferenze utente raccontano una storia diversa.

yupp.ai Co-fondatore Jimmy Lin ha scoperto che”Grok 4 è peggiore di altri modelli: Openai O3, Claude Opus 4 e Gemini 2.5 Pro.”Overfitd”ai test ACE.

Questa attenzione alle metriche fa parte di una più ampia”guerra di riferimento”. I documenti trapelati hanno rivelato appositamente gli appaltatori di XAI per battere Claude di Antropico sulle classifiche di codifica. Critici come Sara Hooker, capo dei laboratori di Cohere, sostengono che”quando una classifica è importante per un intero ecosistema, gli incentivi sono allineati per essere colpiti.”

I lanci di duello e travagliati dai principali attori del settore rivelano una verità difficile. La pressione incessante per innovare e dominare sta spingendo i modelli fuori dalla porta prima che siano veramente pronti. Per gli utenti, questo significa navigare in un paesaggio di strumenti potenti ma profondamente imperfetti.

Categories: IT Info