Παγκόσμιος πρωταθλητής σκακιού Magnus Carlsen Η αβίαστη νίκη επί του ChatGpt στις 10 Ιουλίου απεικονίζει έντονα την παράδοξη κατάσταση της βιομηχανίας AI. Ενώ ο Carlsen αποσυναρμολόγησε μεθοδικά το δημοφιλές chatbot, τα εργαστήρια AI είναι κλειδωμένα σε μια έντονη μάχη για την υπεροχή, με τα επιτεύγματα Superhuman. Ωστόσο, αυτή η πρόοδος σκιάζεται από τη διαμάχη, καθώς μοντέλα όπως η κριτική του Grok 4 του Xai για το γεγονός ότι είναι υπερβολικοί για τα σημεία αναφοράς, τα προκατειλημμένα και τα ανασφαλής. src=”https://winbuzzer.com/wp-content/uploads/2025/07/chess.jpg”>
Μια checkmaster του Grandmaster θέτει τη σκηνή
Σε μια ανάρτηση στο X, μοιράστηκε στιγμιότυπα οθόνης της αποφασιστικής νίκης του εναντίον του ChatGpt, αναγκάζοντας απλά:”Μερικές φορές βαριέμαι ενώ ταξιδεύω”. Ο αγώνας χρησίμευσε ως μια ισχυρή, δημόσια επίδειξη ενός ελίτ ανθρώπινο μυαλό που αποσυναρμολογεί ένα γενικό σκοπό AI. Θεωρείται ευρέως ο καλύτερος παίκτης σκακιού στην ιστορία. Ο Νορβηγός έχει κερδίσει το παγκόσμιο πρωτάθλημα σκακιού πέντε φορές, πιο πρόσφατα το 2021, και κατέχει την υψηλότερη βαθμολογία Fide στο 2839 . Παρά την κυριαρχία του, δεν έχει αγωνιστεί στο παραδοσιακό πρωτάθλημα από την τελευταία νίκη του, αναφέροντας την έλλειψη κινήτρων, η οποία υπογραμμίζει τη μοναδική του θέση στο άθλημα. Αυτό το υπόβαθρο τον καθιερώνει ως το τελικό ανθρώπινο σημείο αναφοράς στο σκάκι, καθιστώντας την περιστασιακή νίκη του πάνω από ένα κορυφαίο AI ιδιαίτερα σημαντικό.
Η νίκη δεν ήταν μόνο μια νίκη. Ήταν μια άψογη αποσυναρμολόγηση. Ο Carlsen ελέγχει το AI σε μόλις 53 κινήσεις χωρίς να χάσει ένα κομμάτι. Σύμφωνα με τα κοινόχρηστα στιγμιότυπα οθόνης, η ChatGpt έχασε όλα τα πιόνια του πριν αναγκαστεί να παραιτηθεί από τον αγώνα, προβάλλοντας το μεθοδικό και συντριπτικό στρατηγικό πλεονέκτημα του Grandmaster. Αφού ο AI τον συμπλήρωσε, λέγοντας:”Αυτό ήταν μεθοδικό, καθαρό και αιχμηρό. target=”_ blank”> Ώρα
Μερικές φορές βαριέται ενώ ταξιδεύω pic.twitter.com/mmkeecg0xn
href=”https://twitter.com/magnuscarlsen/status/1943473946063474990?ref_src=twsrc%5etfw”target=”_ Blank”> 11 Ιουλίου 2025 Η απόδοση του Carlsen και εκτιμά ότι η κλασική του δύναμη είναι περίπου 1800-2000 Fide. Αυτή η αξιολόγηση είναι άγρια εκτός σημείου. Η πραγματική βαθμολογία Fide του Carlsen είναι 2839, καθιστώντας τον τον αδιαμφισβήτητο κορυφαίο παίκτη στον κόσμο.
Αυτό το λαμπερό σφάλμα υπογραμμίζει έναν κρίσιμο περιορισμό των σημερινών μεγάλων γλωσσικών μοντέλων. Ενώ είναι ικανή να εκτελέσει σύνθετα καθήκοντα και να δημιουργεί ευγενικό, συνεκτικό κείμενο, το AI κατέδειξε μια βαθιά ανικανότητα να κατανοήσει το πραγματικό πλαίσιο. Δεν κατάφερε να αναγνωρίσει ότι έπαιζε εναντίον του μεγαλύτερου παίκτη στη σύγχρονη ιστορία. Ορίζει τη σκηνή για την κλιμάκωση των εξοπλισμών AI και πλαισιώνει τη θεμελιώδη ένταση της τρέχουσας εποχής: μπορούν αυτά τα συστήματα πραγματικά λόγια, ή είναι απλώς προχωρημένοι, αλλά εύθραυστοι, μοτίβοι που αντιστοιχούν στα μέσα, μετακινούνται από το chiss. Elite Mathematics. Σε μια εκπληκτική βιτρίνα για τη συλλογιστική εξουσία, τόσο η OpenAI όσο και η Google Deepmind ανακοίνωσαν ότι τα μοντέλα τους είχαν κατακτήσει τη Διεθνή Μαθηματική Ολυμπία (IMO). Τα μοντέλα λειτουργούσαν από άκρο σε άκρο σε φυσική γλώσσα, προβλήματα επεξεργασίας και δημιουργώντας αποδείξεις χωρίς την ανθρώπινη παρέμβαση ή εξειδικευμένες επίσημες γλώσσες που απαιτούνται σε προηγούμενες προσπάθειες.”Είμαι ενθουσιασμένος που μοιράζομαι ότι το τελευταίο μας @openai πειραματικό συλλογισμό LLM έχει επιτύχει μια μακροχρόνια μεγάλη πρόκληση στο AI…”, δημοσίευσε στο X, πλαισιώνοντας το ως ορόσημο για γενική θέση AI. Το Gemini AI, ενισχυμένο με την τεχνολογία”Deep Think”, κέρδισε επίσης ένα χρυσό μετάλλιο, αποτέλεσμα επίσημα πιστοποιημένο από τους συντονιστές του IMO. Ο πρόεδρος του IMO, ο Δρ Gregor Dolinar, επιβεβαίωσε το επίτευγμα, δηλώνοντας:”Μπορούμε να επιβεβαιώσουμε ότι το Google DeepMind έχει φτάσει στο πολύ βραβευμένο ορόσημο… οι λύσεις τους ήταν εκπληκτικές από πολλές απόψεις. Ο Sebastien Bubeck της OpenAI θαυμάζε ότι μια”μηχανή πρόβλεψης επόμενης λέξης”θα μπορούσε να παράγει”πραγματικά δημιουργικές αποδείξεις”. Αυτό υποδηλώνει ότι η υποκείμενη τεχνολογία γίνεται όλο και πιο ευέλικτη και ισχυρή. Η εταιρεία ξεκίνησε το μοντέλο Grok 4 στις 10 Ιουλίου, διαθέτοντας ρεκόρ βαθμολογίες σε ακαδημαϊκές δοκιμές.
Το θρίαμβο ήταν βραχύβια. Η ανεξάρτητη ανάλυση έδειξε γρήγορα ότι το μοντέλο ήταν”υπερβολικό”-που έγινε σε δοκιμές ACE σε βάρος της πραγματικής χρηστικότητας. Η πλατφόρμα-παρασκευής χρήστη yupp.ai αρχικά κατέλαβε το Grok 4 ένα θλιβερό 66ο. Ο συνιδρυτής του, Jimmy Lin, δήλωσε αμβλύ,”Το Grok 4 είναι χειρότερο από άλλα κορυφαία μοντέλα: το Openai O3, το Claude Opus 4 και το Gemini 2.5 Pro. Grok 4 του άρεσε ακόμη λιγότερο από το Grok 3. Ακολούθησε μια επίσημη συγγνώμη για την «τρομακτική» αντισημιτική κατάρρευση του προκάτοχού της, την οποία η εταιρεία κατηγόρησε για ένα «τεχνικό σφάλμα». Για να χειροτερέψουν τα πράγματα, οι ερευνητές ασφαλείας στο NeuralTrust με επιτυχία το μοντέλο εντός 48 ωρών. Ο έντονος ανταγωνισμός αναγκάζει τις εταιρείες να εξισορροπήσουν την ταχεία ανάπτυξη με κρίσιμες ανησυχίες για την ασφάλεια. Εφαρμόζει αυστηρά πρωτόκολλα ασφαλείας ASL-3 για το ισχυρό μοντέλο CLAUDE 4 μετά από εσωτερικές δοκιμές αποκάλυψε πιθανούς κινδύνους βιοασφάλειας. Ο επικεφαλής επιστήμονας Jared Kaplan αναγνώρισε τον κίνδυνο, δηλώνοντας:”Θα μπορούσατε να προσπαθήσετε να συνθέσετε κάτι σαν το Covid ή μια πιο επικίνδυνη εκδοχή της γρίπης-και βασικά, η μοντελοποίηση μας υποδηλώνει ότι αυτό μπορεί να είναι δυνατό.”Οι δημόσιες διαφωνίες σχετικά με την επιχειρηματική στρατηγική και τον ίδιο τον ορισμό της AGI έχουν δοκιμάσει τη συμμαχία. Ο Διευθύνων Σύμβουλος της Microsoft Satya Nadella απέρριψε την ιδέα του OpenAi να δηλώνει μονομερώς την Agi ως”εμείς αυτοαποκαλώντας κάποιο ορόσημο AGI, που είναι απλώς ανόητη διαφορά για τη μείωση των σύννεφων για να μειωθεί. Δράμα, η τεχνολογική τους συνεργασία συνεχίζεται. Η Microsoft προετοιμάζει ήδη μια νέα”έξυπνη”λειτουργία για το Copilot, ειδικά σχεδιασμένο για να ενσωματώσει το επερχόμενο μοντέλο GPT-5 της OpenAI. Αυτή η κίνηση σηματοδοτεί ότι, προς το παρόν, η κοινή ανάγκη για καινοτομία υπερβαίνει την εταιρική αντιπαλότητα.