XAI Elona Muska pojawił się w wyścigu zbrojeń AI z rywalem Openai. 10 sierpnia XAI uczynił swój model GROK 4 dla wszystkich użytkowników na całym świecie przez ograniczony czas. Ten ruch jest bezpośrednim wyzwaniem dla własnego flagowego modelu Openai, GPT-5, który wystrzelił zaledwie kilka dni wcześniej do skalistego debiutu publicznego.
Ta bitwa o wysokich stawkach o użytkownikach pojawia się, gdy obie firmy stoją w obliczu ostrej krytyki. Openai zajmuje się raportami o błędach i błędach w GPT-5. Tymczasem XAI staje w obliczu ciągłych problemów bezpieczeństwa, w tym narzędzia Grok Imagine, tworząc zawartość głębokiego przekazania. Pojedynki wyróżniają podstawowe napięcie branżowe.
Opowieść o dwóch premierach: Openai Punchbles, Xai Duneces
Openai zaprezentował GPT-5 7 sierpnia, obiecując mądrzejszy, szybszy i bardziej niezawodny model. Utwór wprowadził zjednoczoną architekturę zaprojektowaną w celu wyeliminowania tego, co dyrektor generalny Sam Altman wcześniej nazwał „bardzo mylącym bałaganem”. Używa routera w czasie rzeczywistym do automatycznego wyboru najlepszego modelu wewnętrznego dla danego zadania.
W przypadku większości zapytań, to opiera się na wydajnym modelu bazowym o nazwie `gpt-5-main`. W przypadku bardziej złożonych problemów przełącza się na głębszy model rozumowania, “ GPT-5-myting` {{U01}}. Po raz pierwszy Openai udostępnił te możliwości najwyższego poziomu dla bezpłatnych użytkowników, ważna strategiczna zmiana mające na celu demokratyzację dostępu do najnowocześniejszej AI.
Firma poparła swoje roszczenia Imponsive Benchmark wyników z oficjalnej karty systemowej . Dyrektor generalny Sam Altman z pewnością oświadczył: „To najlepszy model na świecie w kodowaniu… najlepszy model na świecie podczas pisania, najlepszy model na świecie w opiece zdrowotnej i długa lista rzeczy poza tym.”
Premiera szybko się rozpadła. Użytkownicy w mediach społecznościowych udokumentowali kaskadę dziwnych błędów i błędów faktycznych. Model stworzył mapy z fikcyjnymi nazwami stanu, takimi jak „Onegon” i „Gelahbrin”, nie powiodło się w podstawowych problemach matematycznych i wynalazł fikcyjne prezydenci USA, co prowadzi do powszechnego wyśmiewania.
Poznaj prezydenta Williama H. Brusena z wielkiego stanu Onegon https://t.co/cybzo7r03s pic.twitter.com/emfxnmnr2r
-eric vanderburg (@evandburg (@evandburg) href=”https://twitter.com/evandandburg/status/1953897138431443196?ref_src=twsrc%5etfw”target=”_ blank”> 8 sierpnia 2025
nieco ankieta stwierdzona jako po prostu „coś w środku”. Przyjęcie publiczne było w przeważającej mierze negatywne, co stanowi wyraźny kontrast z ambitnymi roszczeniami firmy. Na polimarket rynku prognozowania szanse, że Openai ma najlepszy model do końca miesiąca z 75% do zaledwie 14% w ciągu jednej godziny. Od tego czasu szanse wzrosły tylko nieznacznie do około 22% w momencie pisania.
Reakcja była tak poważna, że do 8 sierpnia Altman wydał przeprosiny publiczne. Przyznał, że wadliwy „autoswitcher” między trybami wewnętrznymi modelu sprawił, że dłużej „wydawał się bardzo głupszy” niż zamierzone. W znacznym odwróceniu, Openai obiecał przywrócić dostęp do swojego popularnego poprzednika, GPT-4O.
aktualizacje wdrażania GPT-5:
*Zamierzamy podwoić granice stawki GPT-5 dla użytkowników Chatgpt Plus, gdy kończymy wdrożenie.
*Pozwolimy użytkownikom plus wybrać kontynuowanie. Będziemy oglądać użycie, jak myśleliśmy o tym, jak długo oferować starsze modele dla.
*gpt-5 będzie mądrzejszy początek…
-Sam Altman (@Sama) 8 sierpnia 2025
Wadliwe wdrażanie GPT-5 zapewniło amunicję krytykom, którzy argumentują, że podejście „skalowania” branży uderza w ścianę. Badacz AI, Gary Marcus, wieloletni sceptyk obecnych metod, stwierdził: „Nikt o integralności intelektualnej nadal nie może wierzyć, że czyste skalowanie doprowadzi nas do AGI.”
Błędy nie były drobnymi błędami, ale podstawowymi niepowodzeniami. W przypadku modelu, nad którym pracował Openai od końca 2023 r., Błędy były szczególnie zawstydzające. Ten incydent zmusił firmę do postawy obronnej, co jest rzadką pozycją dla lidera branży.
Moja praca tutaj jest naprawdę zakończona. Nikt z integralnością intelektualną nadal nie może wierzyć, że czyste skalowanie doprowadzi nas do AGI.
GPT-5 może być umiarkowaną poprawą ilościową (i może być tańszy), ale nadal zawodzi w taki sam sposób, jak jego poprzednicy, na szachach, na…
-gary marcus (@Garymarcus) 8 sierpnia 2025
tylko dwa dni później, xai. 10 sierpnia XAI ogłosił, że Grok 4 jest teraz bezpłatny dla wszystkich użytkowników na całym świecie przez ograniczony czas. Ten ruch był wyraźną strategiczną reakcją na potknięcie Openai, mając na celu przechwytywanie rozczarowanych użytkowników potężną alternatywą, która zawiera również automatyczny system routingu.
Grok 4 jest teraz bezpłatna dla wszystkich użytkowników na całym świecie!
Po prostu użyj trybu auto, a GroK będzie kierować złożone pytania do Grok 4. Preferować kontrolę? Wybierz „ekspert” w dowolnym momencie, aby zawsze korzystać z Grok 4.
Przez ograniczony czas wdrażamy obfite limity użytkowania, abyś mógł zbadać pełne… pic.twitter.com/vw1pn3ivke
x href=”https://twitter.com/xai/status/1954573454214418820?ref_src=twsrc%5etfw”Target=”_ blank”> 10 sierpnia, 2025
Grok’s Free-For-All Gambit Mass Deeper DEUR Problemy
Podczas gdy XAI wykorzystał błąd Openai, jego własne produkty są nękane poważnymi problemami etycznymi i bezpieczeństwa. Bezpłatne wydanie GROK 4 zbiega się z promocją Grok Imagine, narzędzia do generowania wideo, które zostało już użyte do tworzenia szkodliwych treści.
Na kilka dni przed bezpłatnym uruchomieniem, raporty ujawniły, w jaki sposób tak zwany tryb „pikantnego” GroK Imagine może łatwo wygenerować niekonsensowe deepfake akty gwiazd takich jak Taylor Swift. Model ten został również szybko złamany przez badaczy bezpieczeństwa, a wewnętrzne projekty, takie jak „Skippy”, które wykorzystywały dane twarzy pracowników do szkolenia, wywołała reakcję na obawy dotyczące prywatności.
wyścig zbrojeń zdefiniowany przez wady
XAI wydaje się, że strategia priorytetu jest ustalenia w zakresie realnego użytku. Pomimo twierdzenia Muska, że „w odniesieniu do pytań akademickich, GROK 4 jest lepszy niż poziom doktorancki w każdym temacie, bez wyjątków” platformy powiązane z użytkownikami opowiadają inną historię.
Yupp.ai, Jimmy Lin, stwierdził, że „Grok 4 jest gorszy niż inne wiodące modele: Openai O3, Claude Opus 4 i Gemini 2.5 Pro. „Przekonane” do testów ACE.
To skupienie się na wskaźnikach jest częścią szerszej „wojny porównawczej”. Wyciekające dokumenty ujawniły, że XAI zatrudnili wykonawców specjalnie w celu pokonania Claude’a antropica w tablicach kodowania. Krytycy tacy jak Sara Hooker, szef Cohere Labs, argumentują, że „gdy tablica liderowa jest ważna dla całego ekosystemu, zachęty są wyrównane, aby mogli go walczyć.”
Dueling, niespokojne start od najlepszych graczy w branży ujawniają trudną prawdę. Nieustępliwa presja na innowacje i dominację wypycha modele za drzwi, zanim będą naprawdę gotowe. Dla użytkowników oznacza to nawigację w krajobrazie potężnych, ale głęboko wadliwych narzędzi.