A sakk világbajnok, Magnus Carlsen könnyedén győzelme a Chatgpt ellen, július 10-én. Miközben Carlsen módszeresen lebontotta a népszerű chatbotot, az AI laboratóriumok heves csatába vannak zárva a felsőbbrendűségért, és július közepén a Google és az Openai mind a Google, mind az OpenAI azt állították, hogy július közepén mind július közepén, mind a Google, mind az Openai azt állították Ezt az előrehaladást azonban az ellentmondások árnyékolják, mivel az olyan modellek, mint a Xai Grok 4, kritikával szembesülnek azért, hogy túlteljesítették a referenciaértékeket, elfogultak és bizonytalanok. src=”https://winbuzzer.com/wp-content/uploads/2025/07/chess.jpg”>

A nagymester ellenőrző társát beállítja a színpadot

július 10-én, a világkapcs bajnok, a Magnus Carlsen, a Magnus Carlsen emlékeztetője. Az X-es bejegyzésben megosztotta képernyőképeit a Chatgpt elleni döntő győzelméről, egyszerűen feldühödve: „Néha unatkozom utazás közben.”A meccs az elit emberi elme hatalmas, nyilvános demonstrációjaként szolgált, amely szétszerel egy általános célú AI-t. Széles körben a történelem legjobb sakkjátékosának tekintik. A norvég ötször, legutóbb 2021-ben nyerte meg a sakk világbajnokságát, és a világ legmagasabb besorolása 2839 . Dominanciája ellenére legutóbbi győzelme óta nem vett részt a hagyományos bajnokságon, hivatkozva a motiváció hiányára, amely hangsúlyozza a sportban való egyedi helyzetét. Ez a háttér a sakkban a végső emberi referenciaértékeként határozza meg őt, így a vezető AI-vel szembeni alkalmi győzelme különösen jelentős.

A győzelem nem csak győzelem volt; Hibátlan szétszerelés volt. Carlsen mindössze 53 mozdulattal ellenőrizte az AI-t, egyetlen darab elvesztése nélkül. A megosztott képernyőképek szerint a Chatgpt elvesztette az összes gyalogját, mielőtt kénytelen volt lemondni a meccsről, bemutatva a nagymester módszertani és elsöprő stratégiai előnyeit. Miután az AI bicitálta őt, mondván: „Ez módszertani, tiszta és éles volt. Jól játszott!”-Carlsen felajánlotta saját kritikáját, megjegyezve, hogy az AI „nagyon jól játszott a megnyitóban”, de „nem tudta követni helyesen”, a idő . href=”https://twitter.com/MagnusCarlsen/status/1943473946063474990?ref_src=twsrc%5Etfw” target=”_blank”>July 11, 2025

In a moment of profound irony, ChatGPT then analyzed Carlsen teljesítménye, és becslése szerint klasszikus ereje 1800-2000 körüli kb. Ez az értékelés vadul el van jelölve a jelöléssel, mivel Carlsen tényleges FIDE besorolása 2839, így a világon vitathatatlanul a legjobban besorolt játékos. Miközben képesek komplex feladatok végrehajtására és udvarias, koherens szöveget generálva, az AI mélységtelen képtelenséget mutatott a valódi kontextus megértésére. Nem tudta felismerni, hogy a modern történelem legnagyobb játékosa ellen játszott. Megállapítja a fokozódó AI fegyverkezési verseny színpadát, és a jelenlegi korszak alapvető feszültségét keretezi: ezek a rendszerek valóban-e, vagy csupán fejlett, mégis törékeny minta-mérkőzők? matematika. Az érvelési hatalom lenyűgöző, hátrányos helyzetű bemutatóján mind az Openai, mind a Google Deepmind bejelentette, hogy modelljeik meghódították a nemzetközi matematikai olimpiadot (IMO).

Ez az áttörés monumentális előrelépést jelent. A modellek a természetes nyelven, a feldolgozási problémákkal és a bizonyítékok generálására szolgáltak a korábbi kísérletek során megkövetelt emberi beavatkozás vagy speciális formális nyelvek nélkül. „Nagyon izgatott vagyok, hogy megoszthatom, hogy a legújabb @openai kísérleti érvelésünk LLM régóta nagy kihívást ért el az AI-ben…”-tette közzé az X-en, és ezt mérföldkövként vázolta az általános célú AI-nek. A „Deep Think” technológiával továbbfejlesztett Gemini AI-je szintén aranyérmet nyert, ezt az eredményt az IMO koordinátorok hivatalosan tanúsították. Az IMO elnöke professzor, Dr. Gregor Dolinar megerősítette az eredményt, kijelentve: „Megerősíthetjük, hogy a Google DeepMind elérte a nagyon vonzódott mérföldkövet. Megoldásaik sok szempontból meglepőek voltak.”

mindkét tábor kutatói hangsúlyozták, hogy ezek nem szűk matematikai megoldások. Az Openai Sebastien Bubbeck csodálkozta, hogy egy „következő szóbeli előrejelző gép” „valóban kreatív bizonyítékokat” tud előállítani. Ez azt sugallja, hogy a mögöttes technológia rugalmasabbá és erősebbé válik. A cég július 10-én indította el a GROK 4 modelljét, és rekordszintű pontszámokkal büszkélkedhet az akadémiai teszteknél.

A Triumph rövid életű volt. A független elemzés gyorsan azt sugallta, hogy a modell „túlteljesített”-az ACE-tesztekhez igazítva a valós használhatóság rovására. A Yupp.ai felhasználói preferencia platformja kezdetben a Grok 4-et rangsorolta a 66. sz. Társalapítója, Jimmy Lin, nyersen kijelentette: „A Grok 4 rosszabb, mint más vezető modellek: Openai O3, Claude Opus 4 és Gemini 2.5 Pro. A Grok 4 még kevésbé kedveli, mint a Grok 3.”Formális bocsánatkérést követett az elődje „szörnyű” antiszemita összeomlásáról, amelyet a vállalat egy „műszaki hibában” hibáztatott. Annak érdekében, hogy az ügyek még rosszabbá váljanak, a NeuralTrust biztonsági kutatói 48 órán belül sikeresen bírják a modellt. A heves verseny arra kényszeríti a vállalatokat, hogy egyensúlyba hozzák a gyors fejlődést a kritikus biztonsági aggályokkal. Szigorú ASL-3 biztonsági protokollokat valósított meg erőteljes Claude 4 modelljéhez, miután a belső tesztelés feltárta a potenciális biobiztonsági kockázatokat. Jared Kaplan, a fő tudós elismerte a veszélyt, és kijelentette: „Megpróbálhatsz szintetizálni valamiféle Covidot vagy az influenza veszélyesebb változatát-és alapvetően a modellezésünk szerint ez lehetséges.”Az üzleti stratégia és az AGI meghatározása szempontjából nyilvános nézeteltérések kipróbálták a szövetséget. A Microsoft vezérigazgatója, Satya Nadella elutasította az Openai egyoldalúan kijelenti az AGI-t, hogy „mi önmagunk önmeghatározással foglalkozik valamilyen Agi mérföldkövet, ez csak értelmetlen benchmark hackelés.”

Ez a súrlódás valós következményekkel jár, a Microsoft a Microsoftnak a Vetoing Openai megvásárlását annak ellenére, hogy az Openai megvásárolja az OpenAI-t, hogy megvásárolja az Openai Openai megvásárlását. Dráma, technológiai együttműködésük folytatódik. A Microsoft már elkészít egy új „intelligens” módot a Copilot számára, amelyet kifejezetten az Openai közelgő GPT-5 modelljének integrálására terveztek. Ez a lépés azt jelzi, hogy egyelőre az innováció közös igénye meghaladja a vállalati rivalizációt.

Categories: IT Info