OpenAI έχει αναστρέψει την απόφαση του Φεβρουαρίου να ακυρώσει το μοντέλο O3, ανακοινώνοντας αντ’αυτού ότι θα ξεκινήσει O3 και O4-Mini τις επόμενες εβδομάδες-Putting GPT-5 σε αναμονή μέχρι αργότερα φέτος. Η ενημέρωση επιβεβαιώθηκε από τον CEO Sam Altman σε μια θέση στο X, όπου είπε ότι η εταιρεία θα κρατήσει τώρα τα μοντέλα που επικεντρώνονται στη συλλογιστική από τα μοντέλα γλωσσών γενικής χρήσης. Μοντέλα συνομιλίας/ολοκλήρωσης.”Ο Altman έγραψε. Πρόσθεσε:”Είμαστε ενθουσιασμένοι για την απόδοση που βλέπουμε από το O3 εσωτερικά.”
src=”https://winbuzzer.com/wp-content/uploads/2023/08/openai-logo.jpg”>
Υπάρχουν πολλοί λόγοι για αυτό, αλλά το πιο συναρπαστικό είναι ότι θα μπορέσουμε να κάνουμε το GPT-5 πολύ καλύτερο από εμάς… href=”https://twitter.com/sama/status/1908167621624856998?ref_src=twsrc%5etfw”target=”_ blank”> 4 Απριλίου, 2025 σε GPT-5. Η στρατηγική αυτή αποσκοπούσε στη μείωση της σύγχυσης του χρήστη και στην εκκαθάριση της πολυπλοκότητας των προϊόντων. Ο OpenAi είπε ότι ήθελε να δημιουργήσει ένα μόνο σύστημα που θα μπορούσε να εξυπηρετήσει όλες τις λειτουργίες χωρίς να απαιτείται”Picker Model”. Ρυθμίσεις χαμηλής απόδοσης και 91,5% σε λειτουργία υψηλής απόδοσης. Στο σημείο αναφοράς των μαθηματικών AIME 2024, έφτασε το 96,7%. Εκτέλεσε επίσης καλά στο GPQA Diamond, μια δοκιμασία για τη λογική επιστημονικής επιστημονικής διδασκαλίας, με βαθμολογία 87,7%. Αυτοί οι αριθμοί τοποθετούν O3 πάνω από GPT-4.5 και O3-Mini σε συγκεκριμένα τεχνικά καθήκοντα, ειδικά σε δομημένους τομείς. Αυτό του επιτρέπει να αντιμετωπίσει τα σύνθετα προβλήματα πολλαπλών βημάτων πιο αποτελεσματικά από τα προηγούμενα μοντέλα. Το O3 επιτρέπει στους προγραμματιστές να αυξάνουν το βάθος λογικής, αλλά το εμπόδιο είναι απότομη χρήση υπολογισμού-μέχρι 172 φορές περισσότερο σε διαμορφώσεις υψηλής απόδοσης. Αυτές οι απαιτήσεις επιβεβαιώθηκαν στο blog Benchmark ARC και έθεσαν ερωτήσεις σχετικά με τη σκοπιμότητα σε κλίμακα. Με βάση τις συμβάσεις ονομασίας του OpenAI, πιθανώς προσφέρει μειωμένες απαιτήσεις υπολογισμών με πολλά από τα ίδια οφέλη συλλογιστικής. Η Εταιρεία δεν έχει μοιραστεί ακόμη δημόσια σημεία ή προδιαγραφές. Στις 20 Μαρτίου, η εταιρεία ξεκίνησε το O1-Pro μέσω της API Access, με στόχο τις περιπτώσεις χρήσης επιχειρήσεων όπως οι αγωγοί νομικής τεχνολογίας και πράκτορα. Το μοντέλο υποστηρίζει έως και 100.000 μάρκες εξόδου και απαιτεί $ 5 σε προηγούμενες δαπάνες για να ξεκλειδώσετε την πρόσβαση. Η τιμολόγηση ξεκινά από 150 δολάρια ανά εκατομμύριο μάρκες εισόδου και $ 600 για εξόδους.
που περιγράφεται από το OpenAi ως μοντέλο που χρησιμοποιεί περισσότερο υπολογισμό για να σκεφτεί σκληρότερα και να παρέχει σταθερά καλύτερες απαντήσεις, εισήχθη μέσω του νέου API του OpenAi, που προορίζεται για δομημένες εφαρμογές με υψηλή άμεση πολυπλοκότητα. Το κόστος, όπως αναφέρθηκε στις 7 Μαρτίου. Αυτό δείχνει μια απόκλιση στα επιχειρηματικά μοντέλα: τα εργαλεία συλλογιστικής της Microsoft OpenAI σε ευρύτερο λογισμικό, ενώ το OpenAi κερδίζει τη συλλογιστική ως χαρακτηριστικό Premium. Ο Altman λέει ότι το μοντέλο θα φτάσει”σε λίγους μήνες”, αν και δεν έχει δοθεί συγκεκριμένη ημερομηνία. Όταν ξεκινά, το GPT-5 αναμένεται να ενσωματώσει τη συλλογιστική και τη γενιά σε ένα σύστημα. Αυτός ο στόχος είχε αρχικά αναφερθεί στο σχέδιο που έχει πλέον εγκαταλειφθεί το Φεβρουαρίου για να διπλώσει το O3 στο GPT-5. Κυκλοφόρησε στα τέλη Φεβρουαρίου, η GPT-4,5 επέκτεινε το παράθυρο περιβάλλοντος του συστήματος σε 200.000 μάρκες και εισήγαγε βελτιώσεις στην πολυγλωσσική κατανόηση. Ωστόσο, εξακολουθεί να έχει υποβαθμίσει τα σημεία αναφοράς μαθηματικών και επιστήμης σε σύγκριση με το O3-Mini.
Η Altman περιέγραψε το GPT-4.5 ως”το πρώτο μοντέλο που αισθάνεται σαν να μιλάει σε ένα στοχαστικό πρόσωπο”, αλλά παραδέχτηκε ότι το μοντέλο δεν σχεδιάστηκε ως λογική. Η Openai παραδέχτηκε ότι τα μοντέλα όπως το O3-Mini εξακολουθούσαν να ξεπερνούν το GPT-4,5 σε περιοχές υψηλού επιπέδου, όπως η κωδικοποίηση και η προηγμένη επίλυση προβλημάτων. Η μετατόπιση του χάρτη πορείας εκτυλίσσεται παράλληλα με σημαντικές κινήσεις οικονομικών και υποδομών. Την 1η Απριλίου, η εταιρεία ανακοίνωσε μια συμφωνία ύψους 40 δισεκατομμυρίων δολαρίων με επικεφαλής τη Softbank, ωθώντας την αποτίμησή της σε 300 δισεκατομμύρια δολάρια. Η δομή της συμφωνίας-κυρίως δευτερεύουσες πωλήσεις μετοχών-παραβλέπει τους πρώτους υπαλλήλους και τους επενδυτές να εξαργυρώσουν, αυξάνοντας παράλληλα την πίεση στο OpenAI για την αποστολή προϊόντων υψηλής αξίας. Τον Μάρτιο, υπέγραψε συμφωνία υπολογισμού ύψους 11,9 δισεκατομμυρίων δολαρίων με την CoreWeave και έλαβε μετοχικό κεφάλαιο 350 εκατομμυρίων δολαρίων στην εταιρεία. Συνεχίζει επίσης την ανάπτυξη προσαρμοσμένων AI Chips σε συνεργασία με την Broadcom και την TSMC, με τα πρώτα σχέδια που αναμένονται αργότερα φέτος.
Μοντέλο ανοιχτού βάρους και διαφάνεια Push
Λίγο πριν από την αναστροφή του O3, ο Altman ανακοίνωσε επίσης ότι η OpenAI προετοιμάζει την απελευθέρωση του πρώτου μοντέλου γλώσσας ανοιχτού βάρους από το GPT-2. Περιέγραψε το μοντέλο ως”αρκετά ικανό”και ζήτησε από τους προγραμματιστές και τους ερευνητές να παρέχουν ανατροφοδότηση σχετικά με τον τρόπο βελτίωσης της χρησιμότητάς του. Η εταιρεία διευκρίνισε ότι το μοντέλο θα περιλαμβάνει προ-εκπαιδευμένα βάρη, αλλά όχι δεδομένα εκπαίδευσης ή κώδικα. Ο Altman έγραψε. Η κίνηση έρχεται εν μέσω της αυξανόμενης ζήτησης προγραμματιστών για διαφάνεια και ανταποκρινόμενη στον ανταγωνισμό από μοντέλα ανοιχτού κώδικα που απελευθερώνεται από Meta, Mistral και Deepseek. Τον Φεβρουάριο, η εταιρεία άρχισε να αποκαλύπτει εσωτερικά ίχνη από το O3-Mini, βοηθώντας τους προγραμματιστές και τους ερευνητές να κατανοήσουν πώς τα μοντέλα φτάνουν στις απαντήσεις. Η απόφαση αυτή αντικατοπτρίζει μια ευρύτερη μετατόπιση προς την εξήγηση σε όλη την οικογένεια μοντέλων συλλογιστικής της εταιρείας. Αντί να περιμένουν να δεσμεύσουν δυνατότητες σε ένα μοντέλο συνολικών συνόρων, η OpenAI απελευθερώνει τώρα εξειδικευμένα εργαλεία καθώς γίνονται έτοιμοι για παραγωγή.
Η μετατόπιση έρχεται με συμβιβασμούς. Οι χρήστες αντιμετωπίζουν τώρα περισσότερους τύπους μοντέλων, αλλά ο καθένας είναι καλύτερα βελτιστοποιημένος για συγκεκριμένες εργασίες. Οι επιχειρήσεις μπορούν να υιοθετήσουν μοντέλα συλλογιστικής υψηλής ποιότητας όπως το O1-Pro, ενώ οι προγραμματιστές αποκτούν πρόσβαση σε ενδιάμεσα συστήματα όπως το O4-Mini-ή σε ανοικτές εκδόσεις για πιο διαφανή πειραματισμό. Το αν η GPT-5 τελικά θα εδραιώσει αυτές τις προσφορές-ή θα είναι απλώς ένας άλλος κλάδος στο επεκτατικό δέντρο μοντέλων της εταιρείας-παραμένει να δει.