Xai i Elon Musk është rritur në garën e armëve të AI kundër rivalit Openai. Më 10 gusht, Xai e bëri modelin e saj Grok 4 falas për të gjithë përdoruesit në të gjithë globin për një kohë të kufizuar. Masa është një sfidë e drejtpërdrejtë për modelin e vetë flamurit të Openai, GPT-5, i cili filloi vetëm disa ditë më parë në një debutim publik të shkëmbit. Openai po merret me raporte për gabime dhe gabime në GPT-5. Ndërkohë, Xai përballet me çështje të vazhdueshme të sigurisë, duke përfshirë mjetin e tij GROK Imagine për krijimin e përmbajtjes së Deepfake. Nisjet e duelimit nxjerrin në pah një tension thelbësor të industrisë. Nisja prezantoi një arkitekturë të unifikuar të krijuar për të eleminuar atë që CEO Sam Altman e kishte quajtur më parë një”rrëmujë shumë konfuze”. Ai përdor një ruter në kohë reale për të zgjedhur automatikisht modelin më të mirë të brendshëm për një detyrë të caktuar. Për probleme më komplekse, ai kalon në një model të arsyetimit më të thellë, `GPT-5-Mendimi` {{U01}. Për herë të parë, Openai i vuri në dispozicion këto aftësi të nivelit të lartë për përdoruesit e lirë, një zhvendosje e madhe strategjike që synon të demokratizojë qasjen në AI-në e artit. href=”https://cdn.openai.com/pdf/8124a3ce-ab78-4f06-96eb-49ea29ffb52f/gpt5-system-card-aug7.pdf”target=”_ bosh”> rezultate mbresëlënëse nga karta e tij zyrtare e sistemit . CEO Sam Altman deklaroi me besim,”Ky është modeli më i mirë në botë në kodim… modeli më i mirë në botë në të shkruar, modeli më i mirë në botë në kujdesin shëndetësor dhe një listë e gjatë e gjërave përtej kësaj.”
Nisja, megjithatë, u zbulua shpejt. Përdoruesit në mediat sociale dokumentuan një kaskadë të gabimeve të çuditshme dhe gabimeve faktike. Modeli prodhoi hartat me emra të shtetit imagjinar si”Ongon”dhe”Gelahbrin”, dështuan në problemet themelore të matematikës, dhe shpikën presidentët e trilluar të SHBA, duke çuar në tallje të gjerë. target=”_blank”> https://t.co/cybzo7r03s 8 gusht 2025
Pritja e publikut ishte jashtëzakonisht negative, një kontrast i ashpër me pretendimet ambicioze të kompanisë. Në polimarket e tregut të parashikimit, shanset e Openai që kanë modelin më të mirë deri në fund të muajit u rrëzuan nga 75% në vetëm 14% në një orë të vetme. Që atëherë, shanset u rivendosën vetëm pak në rreth 22% në kohën e shkrimit.
Reagimi ishte aq i rëndë sa deri më 8 gusht, Altman lëshoi një falje publike. Ai pranoi një”autoswitcher”të gabuar midis mënyrave të brendshme të modelit e kishte bërë atë për një kohë më të gjatë”dukej mënyra më e dashur”sesa ishte menduar. Në një përmbysje të konsiderueshme, Openai premtoi të rivendoste hyrjen në paraardhësin e tij popullor, GPT-4O. Ne do të shikojmë përdorimin ndërsa mendojmë se sa kohë për të ofruar modele të trashëgimisë për. Target=”_ bosh”> 8 gusht 2025
Pjesëmarrja e metë e GPT-5 ka siguruar municion për kritikët që argumentojnë se qasja e”shkallëzimit”të industrisë po godet një mur. Studiuesi i AI Gary Marcus, një skeptik i gjatë i metodave aktuale, deklaroi,”Askush me integritet intelektual ende nuk mund të besojë se shkallëzimi i pastër do të na çojë në AGI.”Për një model për të cilin Openai kishte punuar që nga fundi i vitit 2023, gabimet ishin veçanërisht të turpshme. Incidenti e detyroi kompaninë në një qëndrim mbrojtës, një pozicion i rrallë për udhëheqësin e industrisë.
Puna ime këtu është bërë me të vërtetë. Askush me integritet intelektual ende nuk mund të besojë se shkallëzimi i pastër do të na çojë në AGI. href=”https://twitter.com/garmarcus/status/1953939152594252170?ref_src=twsrc%5etfwww”target=”_ bosh”> 8 gusht 2025
Grok 4 tani është falas për të gjithë përdoruesit në të gjithë botën! Zgjidhni”Ekspert”në çdo kohë për të përdorur gjithmonë Grok 4. href=”https://twitter.com/xai/status/19545734542144418820?ref_src=twsrc%5etfw”target=”_ bosh”Ështjet
Ndërsa Xai kapitalizoi në gabimin e Openai, produktet e veta janë të rrënuara nga shqetësime serioze etike dhe të sigurisë. Lëshimi i lirë i Grok 4 përkon me promovimin e Grok Imagine, një mjet për gjenerimin e videos që është përdorur tashmë për të krijuar përmbajtje të dëmshme. Modeli gjithashtu u tërhoq shpejt nga studiuesit e sigurisë dhe projektet e brendshme si”Skippy”, të cilat përdorën të dhëna të fytyrës së punonjësve për trajnime, ngjallën reagime për shqetësimet e intimitetit. Përkundër pretendimit të Musk-ut se”në lidhje me pyetjet akademike, Grok 4 është më i mirë se niveli i doktoratës në çdo temë, pa përjashtime,”platformat e përdoruesit-preferencës tregojnë një histori të ndryshme.”Mbingarkuar”në testet e ACE. Dokumentet e zbuluara zbuluan se Xai punësoi kontraktorë posaçërisht për të mposhtur Claude të Antropikut në tabelat e kodimit. Kritikët si Sara Hooker, Shefi i Laboratorëve të Chere, argumentojnë se”kur një tabelë drejtuese është e rëndësishme për një ekosistem të tërë, stimujt janë të lidhur që ajo të jetë gamed.”Presioni i pamëshirshëm për të inovuar dhe dominuar po i shtyn modelet nga dera para se të jenë vërtet gati. Për përdoruesit, kjo do të thotë të lundroni në një peizazh me mjete të fuqishme, por thellësisht me të meta.