Ο αγώνας για την υπεροχή του AI έχει φτάσει σε μια νέα κορυφή, καθώς τόσο η Google Deepmind όσο και η OpenAi ισχυρίζονται τώρα ότι τα μοντέλα τους μπορούν να κατακτήσουν τη Διεθνή Μαθηματική Ολυμπιάδα (IMO), μία από τις πιο δύσκολες πνευματικές προκλήσεις της ανθρωπότητας. href=”https://deepmind.google/discover/blog/advanced-version-of-gemini-with-deep-think-officially-achieves-gold-medal-standard-at-the-international-mathematical-olympiad/”rplank”> Οι ειδήσεις που προσγειώθηκαν λίγες μέρες μετά το γεγονός ότι ο αντίπαλος OpenAI αποκάλυψε ότι το δικό του μοντέλο είχε επιτύχει ανεπίσημα την ίδια βαθμολογία κορυφαίων επιπέδων. Αποδεικνύει ότι τα μοντέλα γενικής χρήσης μπορούν τώρα να λύσουν σύνθετα μαθηματικά προβλήματα σε ελίτ ανθρώπινο επίπεδο, κλιμακώνοντας την αντιπαλότητα μεταξύ των δύο ηγετών AI. Twist

Το προηγμένο μοντέλο Gemini της Google DeepMind, ενισχυμένο με τεχνολογία”Deep Think”, λύθηκε πέντε από έξι εξαιρετικά δύσκολα προβλήματα τέλεια. Κέρδισε 35 από ένα πιθανό 42 πόντους, ένα σκορ καλά μέσα στο Το χρυσό μετάλλιο για το φετινό διαγωνισμό . Ο πρόεδρος του IMO, ο Δρ Gregor Dolinar, επιβεβαίωσε το επίτευγμα, δηλώνοντας:”Μπορούμε να επιβεβαιώσουμε ότι η Google DeepMind έχει φτάσει στο πολύ επιθυμητό ορόσημο, κερδίζοντας 35 από τους πιθανούς 42 βαθμούς-ένα χρυσό μετάλλιο. Οι λύσεις τους ήταν εκπληκτικές από πολλές απόψεις”. Ωστόσο, η επίσημη δήλωση του IMO διευκρίνισε ότι το μόνο φυσική γλώσσα. Επεξεργάστηκε τις επίσημες περιγραφές προβλημάτων και δημιούργησε αυστηρές μαθηματικές αποδείξεις άμεσα, όλα μέσα στο αυστηρό χρονικό όριο ανταγωνισμού 4,5 ωρών

Αυτό το άλμα προωθεί την ανάγκη για εμπειρογνώμονες να μεταφράζουν προβλήματα σε επίσημες γλώσσες όπως η Lean, μια δυσκίνητη διαδικασία που προηγουμένως περιόρισε την ταχύτητα και την αυτόνομη ταχύτητα του συστήματος. Παρουσιάζει μια πιο ευέλικτη και ισχυρή μορφή λογικής AI. Ο ερευνητής του OpenAi Noam Brown υπογράμμισε:”Αυτό δεν είναι ένα συγκεκριμένο μοντέλο imo. Είναι ένα λογικό LLM που ενσωματώνει νέες τεχνικές πειραματικής γενικής χρήσης”, ένα συναίσθημα που αντανακλάται από τους συναδέλφους του. Αυτό υποδηλώνει ότι τα υποκείμενα μοντέλα είναι ευρέως ικανά, όχι μόνο στενοί ειδικοί μαθηματικών. Αυτή η λειτουργία ενσωματώνει παράλληλη σκέψη, επιτρέποντας στο μοντέλο να διερευνήσει και να συνδυάσει πολλαπλές δυνητικές διαδρομές λύσεων ταυτόχρονα, αντί να επιδιώκει μια ενιαία, γραμμική αλυσίδα σκέψης. Για την OpenAi, επιτυγχάνοντας αυτό που ο Διευθύνων Σύμβουλος Sam Altman ονομάζεται”όνειρο”,”Όταν ξεκινήσαμε το OpenAi, αυτό ήταν ένα όνειρο, αλλά δεν αισθάνθηκε πολύ ρεαλιστική για εμάς”, χρησιμεύει ως ισχυρή αντεπίθεση για τις αφηγήσεις μιας εταιρείας που χάνει την άκρη του. Ο ερευνητής του OpenAi Alexander Wei σημείωσε ότι το επίτευγμα αντιπροσωπεύει μια”μακροχρόνια μεγάλη πρόκληση στο AI”, προσθέτοντας”Είμαι ενθουσιασμένος που μοιράζομαι ότι οι τελευταίοι μας @openai πειραματικοί λόγοι LLM έχουν επιτύχει μια μακροχρόνια πρόκληση στο AI: Gold Medal inserence στο Google in research στο Google. Deepmind, εξέφρασε την εμπιστοσύνη για τα επόμενα βήματα, λέγοντας:”Είμαστε πολύ σίγουροι ότι μπορούμε να φέρουμε [το μοντέλο] στα χέρια των αξιόπιστων δοκιμαστών μας πολύ σύντομα, ειδικά των μαθηματικών”. Ο στόχος είναι να τεθούν αυτά τα εργαλεία στα χέρια των μαθηματικών για να τους βοηθήσουν να λύσουν ακόμη πιο σκληρά προβλήματα. Ένα AI που μπορεί να λόγο με αυτό το επίπεδο δημιουργικότητας και αυστηρότητας θα μπορούσε να επιταχύνει τις ανακαλύψεις σε όλη την επιστήμη, τη μηχανική και την έρευνα, φέρνοντάς μας ένα βήμα πιο κοντά στον τελικό στόχο της AGI.