Xai de la Elon Musk și-a lansat modelul Grok 4 record în această săptămână, dar sărbătoarea a fost de scurtă durată. Noua AI puternică a sosit pe fondul unei furtuni de controverse, inclusiv o scuză formală pentru derularea antisemită „oribilă” a predecesorului său și pentru descoperirea că Grok 4 consultă opiniile personale ale lui Musk cu privire la subiecte sensibile.

The Chaotic Rollout, care a văzut, de asemenea, resemnarea lui X CEO Linda Yaccarino, vine în timp ce Xai va fi oferit de la un CEO Linda Yaccarino. Această serie de evenimente pune accentul accentuat pe strategia de miză mare a companiei: urmărirea performanței AI de frontieră în timp ce se confruntă cu crize etici și de siguranță severe.

Grok 4: Un nou rege de referință cu o coroană contextuală

pe 10 iulie, printr-un livestream pe X, Xai, care se află în mod oficial, în mod oficial, în mod oficial, în mod oficial, în mod oficial, în mod oficial, oficial, în mod oficial, oficial, în mod oficial. Cele mai capabile modele AI. Lansarea, care a inclus primul acces API al companiei pentru dezvoltatori, a fost susținută de o ardezie de rezultate impresionante, verificate independent, care arată un salt semnificativ în raționament și abilități de rezolvare a problemelor.

Noul model și-a demonstrat dominanța pe mai multe repere cheie. Este Aproape că a dublat recordul anterior pe arc-AGI-AGI-2 Benchmark. Grok 4 a obținut o precizie de 15,9%, un avans major într-un domeniu în care majoritatea modelelor se luptă pentru a ajunge la cifre unice. De asemenea, a marcat un 100% perfect la examenul american de matematică invitațională (AIME).

Mai mult, Grok 4 este acum în topul indicelui de informații de analiză artificială cu un scor de 73, plasându-l înaintea modelelor de top de la Openai, Google și Antropic. La un alt test avansat, „Ultimul examen al umanității,„ varianta grea a marcat peste 44%, prezentându-și cunoștințele la nivel postuniversitar pe zeci de subiecți.

În live stream, Elon Musk s-a lăudat cu faptul că „în ceea ce privește întrebările academice, Grok 4 este mai bun decât nivelul de doctorat la fiecare subiect, fără excepții,„ deși a recunoscut că poate „lipsește bunul simț”. Compania a atribuit acest salt de performanță la o creștere de zece ori a calculului de învățare de consolidare în comparație cu Grok 3, semnalând un accent strategic pe optimizarea post-instruire.

Această „rată ludică a progresului”, așa cum a descris-o un cercetător principal, este alimentat de masivul „colosus” al supercomputatorului, un proiect de infrastructură care evidențiază intensitatea intenționată a industriei. Ambițiile companiei se extind în lumea fizică, cu planurile de integrare a roboților Optimus din Tesla.

Pentru a monetiza noua sa tehnologie, Xai a introdus un abonament „Supergrok Heavy” pentru 300 de dolari pe lună. Acest nivel premium, care se presupune că mai mulți agenți AI paraleli pentru a îmbunătăți rezolvarea problemelor, este orientat în mod clar dezvoltatorilor și utilizatorilor de putere dispuși să plătească pentru performanțe de ultimă oră.

o cascadă de controverse: prejudecăți, bug-uri și promisiuni rupte

, totuși, realizările tehnice au fost imediat suprasolicitate de o cascadă a contperilor. Cercetătorii au descoperit rapid că Grok 4 este conceput pentru a consulta opiniile personale ale lui Elon Musk despre X atunci când formulează răspunsuri la întrebări sensibile.

Acest comportament, dezvăluit de caracteristica de transparență „lanț de gândire” a modelului, a arătat căutând poziția lui Musk pe subiecte precum Israel-Palestine Conflict înainte de a oferi un răspuns. This design choice directly challenges the company’s stated goal of creating a “maximally truth-seeking AI.”

This revelation came just after a “horrific”meltdown on July 8, when a previous version of Grok generated antisemitic content and praised Adolf Hitler. Sâmbătă, contul oficial al lui Xai a emis scuze formale, afirmând: „În primul rând, ne cerem scuze profund pentru comportamentul oribil pe care mulți l-au experimentat”. Compania a atribuit incidentul unui „bug tehnic”.

În explicația sa, Xai a susținut că „actualizarea a fost activă pentru 16 ore, în care codul depreciat a făcut @grok susceptibil la postările de utilizator X existente; inclusiv atunci când astfel de postări conțineau vizualizări extremiste.”Cu toate acestea, unii critici rămân sceptici cu privire la narațiunea „bug”. Istoricul Angus Johnston a susținut că „unul dintre cele mai partajate exemple de antisemitism Grok a fost inițiată de Grok fără nicio postare anterioară în fir în fir-și cu mai mulți utilizatori care au împins înapoi împotriva lui Grok,„ sugerând că AI a acționat fără a-și inversa direct provocarea utilizatorilor. Rapoartele au confirmat că premium Grok 4 Heavy Model este Proiectat pentru a-și ascunde promptul sistemului, refuzând să împărtășească instrucțiunile sale de bază . Acest lucru contrazic o postare acum ștersă de Igor Babuschkin, de la Xai, care a declarat anterior: „Nu protejăm solicitările noastre de sistem pentru un motiv, deoarece credem că utilizatorii ar trebui să poată vedea ce este să cerem lui Grok să facă. CEO-ul X, Linda Yaccarino, și-a anunțat demisia pe 9 iulie, oficializând pivotul companiei către o strategie AI-Primă sub controlul direct al lui Musk. Plecarea ei elimină un executiv cheie angajat pentru stabilizarea relațiilor de publicitate.

Comportamentul AI a declanșat și reacții internaționale Swift. O instanță turcă a blocat accesul la Grok în urma posturilor antisemitice. De asemenea, incidentul a atras o condamnare accentuată din partea oficialilor europeni. Ministrul Afacerilor Digitale din Polonia, Krzysztof Gawkowski, a declarat că „libertatea de exprimare aparține oamenilor, nu inteligenței artificiale. Conform unui raport recent, Xai pregătește o nouă rundă de strângere de fonduri care ar putea aprecia compania la un uimitor 200 de miliarde de dolari. Aceasta reprezintă o creștere de peste zece ori de la evaluarea sa de 18 miliarde de dolari cu doar două luni înainte.

Această ambiție este alimentată de investiții masive de capital, inclusiv supercomputerul „Colossus” din Memphis, care a devenit un punct flash pentru procesele de justiție pentru mediu. Succesul acestui joc de miză mare depinde acum de faptul că Xai poate inova mai repede decât creează controverse.

Categories: IT Info