Fitorja e lehtë e kampionit botëror të shahut Magnus Carlsen ndaj Chatgpt më 10 korrik ilustron në mënyrë të rreptë gjendjen paradoksale të industrisë së AI. Ndërsa Carlsen çmontoi në mënyrë metodike Chatbot popullore, AI Labs janë mbyllur në një betejë të ashpër për epërsi, duke kërkuar arritje mbinjerëzore. Megjithatë, ky përparim është hije nga polemikat, pasi modele si Xai’s Grok 4 përballen me kritika për të qenë të përshtatur për standardet, të njëanshme dhe të pasigurta. src=”https://winbuzzer.com/wp-content/uploads/2025/07/chess.jpg”>

një kontroll i gjyshit vendos fazën e madhe të ekspertizmit dhe artit. Në një postim në X, ai ndau fotografitë e fitores së tij vendimtare kundër Chatgpt, duke u larguar thjesht,”Unë ndonjëherë mërzitem gjatë udhëtimit”. Ndeshja shërbeu si një demonstrim i fuqishëm, publik i një mendjeje elitare njerëzore që çmonton një AI me qëllime të përgjithshme.

Carlsen nuk është vetëm asnjë gjysh; Ai konsiderohet gjerësisht i shahut më i mirë në histori. Norvegjia ka fituar Kampionatin Botëror të Shahut pesë herë, së fundmi në vitin 2021, dhe mban vlerësimi më i lartë në botë në 2839 . Megjithë mbizotërimin e tij, ai nuk ka garuar në kampionatin tradicional që nga fitorja e tij e fundit, duke përmendur mungesën e motivimit, e cila nënvizon pozicionin e tij unik në këtë sport. Kjo sfond e krijon atë si standardin e fundit të njeriut në shah, duke e bërë fitoren e tij të rastësishme ndaj një AI udhëheqëse veçanërisht të rëndësishme.

Fitorja nuk ishte vetëm një fitore; Ishte një çmontim i përsosur. Carlsen kontrolloi AI në vetëm 53 lëvizje pa humbur një pjesë të vetme. Sipas fotografive të përbashkëta, Chatgpt humbi të gjitha pengesat e saj para se të detyrohej të jepte dorëheqjen e ndeshjes, duke treguar avantazhin strategjik metodik dhe dërrmues të gjyshes. Pasi AI e komplimentoi atë, duke thënë:”Kjo ishte metodike, e pastër dhe e mprehtë. E luajtur mirë!,”Carlsen ofroi kritikën e tij, duke përmendur AI”luajti me të vërtetë mirë në hapje”, por”nuk arriti ta ndiqte atë si duhet”, sipas koha .

Unë ndonjëherë mërzitem gjatë udhëtimit 11 korrik 2025 Performanca e Carlsen dhe vlerësoi se forca e tij klasike të ishte rreth 1800-2000 Fide. Ky vlerësim është shumë larg nga shenja; Vlerësimi aktual i FIDE i Carlsen është 2839, duke e bërë atë lojtarin e padiskutueshëm më të vlerësuar në botë. Ndërsa ishte i aftë për të ekzekutuar detyra komplekse dhe për të gjeneruar tekst të sjellshëm, koherent, AI demonstroi një paaftësi të thellë për të kuptuar kontekstin e vërtetë. Ajo nuk arriti ta njohë se po luante kundër lojtarit më të madh në historinë moderne. Ajo vendos fazën për garën e përshkallëzuar të armëve të AI dhe kornizon tensionin themelor të epokës aktuale: a mund të arsyetojnë me të vërtetë këto sisteme, apo janë ato thjesht të përparuara, por të brishta, modelet e modeleve? Elite Matematikë. Në një vitrinë mahnitëse të fuqisë së arsyetimit, të dyja Openai dhe Google Deepmind njoftuan se modelet e tyre kishin pushtuar Olimpiadën Matematike Ndërkombëtare (IMO).

Kjo përparim paraqet një përparim monumental. Modelet operuan nga fundi në fund në gjuhën natyrore, problemet e përpunimit dhe gjenerimin e provave pa ndërhyrjen njerëzore ose gjuhët zyrtare të specializuara të kërkuara në përpjekjet e mëparshme.”Unë jam i entuziazmuar të ndaj se Arsyetimi ynë i fundit @Openai Experimental LLM ka arritur një sfidë të gjatë në AI…”, postoi ai në X, duke e inkuadruar atë si një moment historik për AI me qëllime të përgjithshme.

vetëm dy ditë më vonë, Google Deepmind bëri njoftimin e vet. AI e saj Binjakët, e përmirësuar me teknologjinë”Think Deep”, gjithashtu fitoi një medalje të artë, një rezultat i certifikuar zyrtarisht nga koordinatorët IMO. Presidenti i IMO Prof. Dr Gregor Dolinar konfirmoi arritjen, duke thënë,”Ne mund të konfirmojmë që Google Deepmind ka arritur në pikën e shumë të dëshiruar… zgjidhjet e tyre ishin mahnitëse në shumë aspekte.”Sebastien Bubeck i Openai u mrekullua se një”makinë parashikimi me fjalë të ardhshme”mund të prodhonte”prova vërtet krijuese”. Kjo sugjeron që teknologjia themelore po bëhet më fleksibël dhe më e fuqishme. Kompania nisi modelin e saj Grok 4 më 10 korrik, duke mburrur rezultate rekord në testet akademike.

Triumfi ishte jetëshkurtër. Analiza e pavarur shpejt sugjeroi që modeli ishte”i mbingarkuar”-i detyruar në testet e ACE në kurriz të përdorshmërisë së botës reale. Platforma e Preferencës së Përdoruesit Yupp.ai fillimisht renditi Grok 4 një të 66-të. Bashkëthemeluesi i saj, Jimmy Lin, deklaroi hapur,”Grok 4 është më i keq se modelet e tjera kryesore: Openai O3, Claude Opus 4, dhe Gemini 2.5 Pro. Grok 4 është pëlqyer edhe më pak se Grok 3.”Ajo pasoi një falje zyrtare për shkrirjen antisemitike”të tmerrshme”të paraardhësit të saj, të cilën kompania fajësoi për një”bug teknik”. Për t’i bërë gjërat më keq, studiuesit e sigurisë në NeuralTrust me sukses Jailbroke modeli brenda 48 orëve. Konkurrenca e ashpër po i detyron kompanitë të balancojnë zhvillimin e shpejtë me shqetësime kritike të sigurisë. Ai zbatoi protokollet e rrepta të sigurisë ASL-3 për modelin e tij të fuqishëm Claude 4 pasi testimi i brendshëm zbuloi rreziqe të mundshme të biosigurisë. Shkencëtari kryesor Jared Kaplan pranoi rrezikun, duke thënë,”Ju mund të përpiqeni të sintetizoni diçka si Covid ose një version më të rrezikshëm të gripit-dhe në thelb, modelimi ynë sugjeron që kjo mund të jetë e mundur.”Mosmarrëveshjet publike mbi strategjinë e biznesit dhe vetë përkufizimin e AGI kanë testuar aleancën. Drejtori i Përgjithshëm i Microsoft Satya Nadella hodhi poshtë idenë e Openai duke e deklaruar në mënyrë të njëanshme AGI si”SH.B.A. duke kërkuar një moment historik AGI, kjo është vetëm hakimi i standardeve të pakuptimta.”Drama, bashkëpunimi i tyre teknologjik vazhdon. Microsoft tashmë është duke përgatitur një modalitet të ri”të zgjuar”për Copilot, i krijuar posaçërisht për të integruar modelin e ardhshëm GPT-5 të Openai. Kjo veprim sinjalizon që, tani për tani, nevoja e përbashkët për risi tejkalon rivalitetin e korporatave.

Categories: IT Info