Un capolavoro imperfetto? Grok 4 di Elon Musk è ora l'IA più potente

La XAI di

Elon Musk ha lanciato il suo modello Grok 4 da record questa settimana, ma la celebrazione è stata di breve durata. La potente nuova AI è arrivata in una tempesta di controversie, tra cui una scusa formale per il tracollo antisemitico del suo predecessore e la scoperta che Grok 4 consulta le opinioni personali di Musk su argomenti delicati. This series of events puts a sharp focus on the company’s high-stakes strategy: pursuing frontier AI performance while grappling with severe ethical and safety crises.

Grok 4: A New Benchmark King with a Contentious Crown

On July 10, through a livestream on X, xAI officially unveiled Grok 4 and its more powerful “Heavy”variant, positioning them as the world’s modelli AI più capaci. Il lancio, che includeva il primo accesso API dell’azienda per gli sviluppatori, è stato supportato da una serie di risultati impressionanti e verificati in modo indipendente che mostrano un salto significativo nel ragionamento e nelle capacità di risoluzione dei problemi.

Il nuovo modello ha dimostrato il suo dominio su diversi parametri di riferimento. It ha quasi raddoppiato il record precedente sul difficile record AG-AGI-2 ragionamento di riferimento , un test progettato per misurare l’uomo in astratta. Grok 4 ha raggiunto una precisione del 15,9%, un grande anticipo in un campo in cui la maggior parte dei modelli lotta per raggiungere cifre singole. Ha anche ottenuto un perfetto 100% sull’American Invitational Mathematics Examination (AIME).

Inoltre, Grok 4 ora è in cima all’indice di intelligence di analisi artificiale con un punteggio di 73, posizionandolo davanti ai migliori modelli da Openai, Google e Antropic. In un altro test avanzato,”L’ultimo esame dell’umanità”, la variante pesante ha segnato oltre il 44%, mettendo in mostra le sue conoscenze post-laurea attraverso dozzine di soggetti.

Nel live streaming, Elon Musk si vantava che”per quanto riguarda le domande accademiche, Grok 4 è migliore del livello di dottorato in ogni argomento, senza eccezioni”, sebbene a volte potesse a volte”privo di buon senso”. La società ha attribuito questo salto di prestazioni a un aumento di dieci volte del calcolo dell’apprendimento del rinforzo rispetto a Grok 3, segnalando una attenzione strategica sull’ottimizzazione post-allenamento.

Questo”ridicolo tasso di progresso”, come ha descritto un ricercatore di base, è alimentato dal massiccio supercomputer”Colossus”di Xai. Le ambizioni dell’azienda si estendono al mondo fisico, con i piani per integrare Grok nei robot Optimus di Tesla.

Per monetizzare la sua nuova tecnologia, Xai ha introdotto un abbonamento”Supergrok Heavy”per $ 300 al mese. Questo livello premium, che secondo quanto riferito utilizza più agenti AI paralleli per migliorare la risoluzione dei problemi, è rivolto esattamente agli sviluppatori e agli utenti di potere disposti a pagare per le prestazioni all’avanguardia.

I ricercatori hanno rapidamente scoperto che Grok 4 è progettato per consultare le opinioni personali di Elon Musk su X quando formulano le risposte a domande sensibili.

Questo comportamento, rivelato dalla caratteristica di trasparenza”a catena di pensiero”del modello, ha mostrato la ricerca della stazione di Musk su argomenti come il conflitto israelico prima di fornire una risposta. Questa scelta del design sfida direttamente l’obiettivo dichiarato dell’azienda di creare un”AI in cerca di verità al massimo della verità”.

Questa rivelazione è arrivata subito dopo un”orribile”tracollo l’8 luglio, quando una versione precedente di Grok ha generato contenuti antisemiti e ha elogiato Adolf Hitler. Sabato, l’account ufficiale di Grok di Xai ha emesso scuse formali, affermando:”Prima di tutto, ci scusiamo profondamente per il comportamento orribile che molti hanno vissuto”. La società ha attribuito l’incidente a un”bug tecnico”.

Nella sua spiegazione, Xai ha affermato che”l’aggiornamento era attivo per 16 ore, in cui il codice deprecato reso @Grok suscettibile ai posti di X utente esistenti; incluso quando tali post contenevano viste estremiste”. Tuttavia, alcuni critici rimangono scettici sulla narrazione”bug”. Lo storico Angus Johnston ha sostenuto che”uno degli esempi più condivisi di antisemitismo di Grok è stato avviato da Grok senza alcuna precedente pubblicazione bigottata nel thread-e con più utenti che spingono indietro Grok contro inutilmente”, suggerendo che l’IA ha agito senza la provocazione diretta degli utenti.

Aggiungimento al tumulto, Xai sembrava riaccendere il suo impegno pubblico per la transferazione. I rapporti hanno confermato che il modello pesante Grok 4 premium è progettato per nascondere il suo prompt del sistema, rifiutando di condividere le sue istruzioni di base . Questo contraddice un post ora cancellato da Igor Babykin di Xai, che in precedenza aveva dichiarato:”Non proteggiamo i nostri suggerimenti di sistema per un motivo, perché crediamo che gli utenti dovrebbero essere in grado di vedere cosa stiamo chiedendo a Grok di fare.”

Gambuli ad alto contenuto e le cose in modo significativo. La CEO di X Linda Yaccarino ha annunciato le sue dimissioni il 9 luglio, formalizzando il perno della società in una strategia AI-First sotto il controllo diretto di Musk. La sua partenza rimuove un dirigente chiave assunto per stabilizzare le relazioni degli inserzionisti.

Il comportamento dell’IA ha anche innescato Swift International Backlash. Un tribunale turco ha bloccato l’accesso a Grok a seguito dei posti antisemiti. L’incidente ha anche suscitato una forte condanna da parte di funzionari europei. Il ministro degli affari digitali polacchi, Krzysztof Gawkowski, ha dichiarato che”la libertà di parola appartiene agli umani, non all’intelligenza artificiale”.

Lo sfondo di questo caos operativo è un immenso ambizione finanziaria. Secondo un recente rapporto, Xai sta preparando un nuovo round di raccolta fondi che potrebbe valutare la società con un sorprendente $ 200 miliardi. Ciò rappresenta un aumento di oltre dieci volte rispetto alla sua valutazione di $ 18 miliardi appena due mesi prima.

Questa ambizione è alimentata da enormi investimenti di capitale, incluso il supercomputer”Colossus”a Memphis, che a sua volta è diventato un punto di flash per le cause della giustizia ambientale. Il successo di questa scommessa ad alto margine ora dipende dal fatto che Xai possa innovare più velocemente di quanto crea controversie.

Un capolavoro imperfetto? Grok 4 di Elon Musk è ora l’IA più potente

Published by All Things Windows on July 13, 2025

Grok 4: A New Benchmark King with a Contentious Crown

IT Info

Microsoft svela Quick Machine Recovery, una nuova funzione di auto-guarigione in Windows 11

IT Info

Xai si scusa per il”orribile”tracollo antisemitico di Grok, incolpa un bug tecnico

IT Info

Come eseguire il backup di tutte le unità in Windows usando PowerShell

Un capolavoro imperfetto? Grok 4 di Elon Musk è ora l’IA più potente

Published by All Things Windows on July 13, 2025

Grok 4: A New Benchmark King with a Contentious Crown

Related Posts

IT Info

Microsoft svela Quick Machine Recovery, una nuova funzione di auto-guarigione in Windows 11

IT Info

Xai si scusa per il”orribile”tracollo antisemitico di Grok, incolpa un bug tecnico

IT Info

Come eseguire il backup di tutte le unità in Windows usando PowerShell