OpenAI την Τρίτη κυκλοφόρησε την GPT-OSS-120B και την GPT-OSS-20B, τα πρώτα μοντέλα ανοιχτού βάρους από το 2019. Τα νέα μοντέλα είναι διαθέσιμα με άδεια χρήσης Apache 2.0. Η απελευθέρωση στοχεύει στην αντιμετώπιση της αυξανόμενης δημοτικότητας των ανοικτών μοντέλων από τους αντιπάλους του όπως το meta και κινεζικές επιχειρήσεις. Με την επανεξέταση με την κοινότητα ανοιχτού κώδικα, η OpenAI ελπίζει να θέσει νέα πρότυπα ασφαλείας. Αυτός ο στρατηγικός άξονας σηματοδοτεί την πρώτη απελευθέρωση του μοντέλου γλώσσας ανοιχτού βάρους από το GPT-2 το 2019, απευθύνεται άμεσα σε χρόνια ανατροφοδότησης και απογοήτευσης της κοινότητας. Src=”Δεδομένα: Εικόνα/SVG+XML; Nitro-Empty-ID=MTY1NJOXMDKY-1, BASE64, PHN2ZYB2AWV3QM94PSIWIDAGODM4IDUW Myigd2lkdgg9ijgzocigagvpz2h0psi1mdmiihhtbg5zpsjodhrwoi8vd3d3lnczlm9yzy8ymdawl3n2zyi+pc9zdmc+”>

Αυτή η επιστροφή στις αρχές ανοικτού βάρους ήταν αρχικά πειράζει από τον Διευθύνοντα Σύμβουλο Sam Altman τον Απρίλιο. Η ανακοίνωση ακολουθεί δύο απογοητευτικές καθυστερήσεις τον Ιούνιο και τον Ιούλιο, καθιστώντας τη σημερινή έναρξη μιας πολυαναμενόμενης εκπλήρωσης αυτής της υπόσχεσης για τους προγραμματιστές και τους ερευνητές που εκτιμούν τη διαφάνεια και την προσαρμοστικότητα. Αυτά τα μη διαδρόιμα μοντέλα υψηλής απόδοσης θεωρούνται τώρα ότι ήταν προεπισκοπήσεις Stealth για την επίσημη απελευθέρωση GPT-OSS. href=”https://t.co/pdkhqdqcpf”target=”_blank”> https://t.co/pdkhqdqcpf

href=”https://twitter.com/openai/status/1952783291091653011?ref_src=twsrc%5etfw”target=”_ blank”> 5 Αυγούστου, 2025

Απευθύνεται σε ένα σημαντικό χάσμα στο χαρτοφυλάκιο της OpenAI, όπως σημειώνεται από τον Casey Dvorak, διευθυντή προγράμματος έρευνας στο OpenAI. Href=”https://www.technologyreview.com/2025/08/05/1121092/openai-has-finally-released-open-weight-language-models”Target=”_ blank”> Εξηγείται “

Αυτό επιτρέπει στην εταιρεία να ανταγωνιστεί για προγραμματιστές που προτιμούν ή απαιτούν τοπικά μοντέλα για την ασφάλεια των δεδομένων, το χαμηλότερο κόστος ή την τελειοποίηση σε εξειδικευμένα καθήκοντα. Πέρα από την απλή πλήρωση ενός χάσματος προϊόντων, η κίνηση αφορά επίσης την ανάκτηση επιρροής. Ο Peter Henderson, βοηθός καθηγητής στο Πανεπιστήμιο του Princeton, Το οικοσύστημα.”

Η στρατηγική σημασία αυξάνεται ως Meta, ο μακροχρόνιος ηγέτης στην αμερικανική ΑΙ ανοιχτού κώδικα, μπορεί να αναπροσανατολίζει τις κλειστές απελευθερώσεις. Το Pivot του OpenAi θέτει να γίνει ο νέος πρωταθλητής για την κοινότητα ανοιχτού κώδικα, καταγράφοντας τους προγραμματιστές και τους ερευνητές που αναζητούν μια ισχυρή, επιτρεπόμενη εναλλακτική λύση. Και τα δύο είναι χτισμένα σε ένα μείγμα-του-ειδών (MOE) αρχιτεκτονική, μια βασική επιλογή σχεδιασμού για τη μεγιστοποίηση των επιδόσεων, ενώ ελαχιστοποιεί το υπολογιστικό κόστος, σύμφωνα με την ανακοίνωση του OpenAi . εργασία. Το μοντέλο GPT-OSS-120B, για παράδειγμα, ενεργοποιεί μόλις 5.1b από τις παραμέτρους 117B ανά διακριτικό. Αυτή η απόδοση ενισχύεται περαιτέρω από την εγγενή ποσοτικοποίηση στη μορφή MXFP4, μειώνοντας δραστικά το αποτύπωμα μνήμης

Αυτή η προηγμένη αρχιτεκτονική καθιστά τα μοντέλα εξαιρετικά προσιτά. Το μικρότερο GPT-OSS-20B μπορεί να εκτελεστεί σε συσκευές καταναλωτών με μόλις 16GB μνήμης RAM, ενώ το μεγαλύτερο μοντέλο 120B απαιτεί μόνο μία GPU 80GB, ένα κοινό κομμάτι υλικού σε επαγγελματικούς σταθμούς εργασίας. Και τα δύο μοντέλα είναι διαθέσιμα για λήψη σε αγκάλιασμα προσώπου . Σύμφωνα με την επίσημη κάρτα μοντέλου, η GPT-OSS-120B επιτυγχάνει κοντά στην Parity με την ιδιόκτητη O4-Mini της OpenAI σε βασικά σημεία αναφοράς συλλογιστικής και ακόμη και ξεπερνά το σε εξειδικευμένες δοκιμές όπως το HealthBench και ο διαγωνισμός μαθηματικών AIME. Το μικρότερο GPT-OSS-20B δείχνει παρόμοια ανταγωνιστικότητα έναντι του μοντέλου O3-Mini.

Πώς η GPT-OSS στοιβάζει τα νέα μοντέλα που εκτελούν τα νέα μοντέλα που εκτελούν τους κινητούς ανταγωνιστές. Τα δεδομένα, Το πεδίο, ιδιαίτερα σε εξειδικευμένους τομείς. Για παράδειγμα, με τη γνώση”Biorisk Tacit και την αντιμετώπιση προβλημάτων”, σημείωσε 75,7, μπροστά από το Kimi 2 (74,6), το Deepseek R1 (68,7) και το Qwen3 Thinking (67,8). χαρτί. Οι εξωτερικές αξιολογήσεις που διευθύνονται από την SecureBio επιβεβαίωσαν περαιτέρω ότι η GPT-OSS εκτελεί καλύτερα από το Deepseek-R1-0528 τόσο με όσο και χωρίς εργαλείο περιήγησης. Src=”Δεδομένα: εικόνα/svg+xml; nitro-empty-id=mty1oto4nza=-1, base64, phn2zyb2awv3qm94psiwidagnjg3idu1mc Igd2lkdgg9ijy4nyigagvpz2h0psi1ntaiihhtbg5zpsjodhrwoi8vd3d3lnczlm9yzy8ymdawl3n2zyi+pc9zdmc+”>

Ωστόσο, το OpenAI προσθέτει ένα κρίσιμο κομμάτι του πλαισίου σε αυτά τα αποτελέσματα. Ενώ το μοντέλο που έχει ρυθμιστεί συχνά οδηγεί το πακέτο, το χαρτί καταλήγει στο συμπέρασμα ότι στις περισσότερες αξιολογήσεις,”υπάρχει ήδη ένα άλλο ανοιχτό μοντέλο βάρους που βαθμολογεί στο ή κοντά στο GPT-OSS”. Αυτό υποδηλώνει ότι ενώ η GPT-OSS προχωράει τα σύνορα, δεν δημιουργεί ένα δραματικό, πρωτοφανές άλμα σε ικανότητα έναντι του υπάρχοντος οικοσυστήματος ανοιχτού κώδικα. Είναι πλήρως συμβατά με το API των απαντήσεων του OpenAI, το οποίο ενισχύθηκε τον Μάιο με περισσότερη υποστήριξη εργαλείων. Αυτή η ενσωμάτωση επιτρέπει τις εκλεπτυσμένες ροές εργασίας με ισχυρές δυνατότητες που ακολουθεί διδασκαλία και εργαλεία. Src=”Δεδομένα: εικόνα/svg+xml; nitro-empty-id=mty2mjo5mjc=-1, base64, phn2zyb2awv3qm94psiwidagnjg4iduzny Igd2lkdgg9ijy4ocigagvpz2h0psi1mzciihhtbg5zpsjodhrwoi8vd3d3lnczlm9yzy8ymdawl3n2zyi+pc9zdmc+”>

Βασικά χαρακτηριστικά περιλαμβάνουν πλήρη πρόσβαση στην αλυσίδα της αλυσίδας του μοντέλου (COT) για διαφανή συλλογιστική, υποστήριξη για δομημένες εξόδους και την ικανότητα προσαρμογής της προσπάθειας συλλογικής μεταξύ χαμηλών, μεσαίων και υψηλών ρυθμίσεων μέσω μιας απλής γραμμής συστήματος. Αυτή η ευελιξία επιτρέπει στους προγραμματιστές να εξισορροπούν την απόδοση, το κόστος και την καθυστέρηση για τις συγκεκριμένες εφαρμογές τους. Ο ακρογωνιαίος λίθος αυτής της απελευθέρωσης είναι η εκτεταμένη έρευνα ασφαλείας της OpenAI. Η εταιρεία μελετούσε προληπτικά τα χειρότερα σενάρια μέσω μιας διαδικασίας που ονομάζει”κακόβουλη τελειοποίηση”(MFT). Οι ερευνητές προσπάθησαν σκόπιμα να καταστήσουν τα μοντέλα επιβλαβή, μια διαδικασία που εξετάζεται από εξωτερικούς εμπειρογνώμονες. Ο στόχος ήταν να δούμε αν ένας εισβολέας θα μπορούσε να δημιουργήσει ένα επικίνδυνο εργαλείο. Τα ευρήματα, Δημοσιεύθηκε με λεπτομέρεια το χαρτί ασφαλείας, Μοντέλα

Ακόμη και μετά από αυτή την αντιπαράθεση ρύθμιση, τα μοντέλα δεν έφτασαν στο κατώφλι”υψηλής”ικανότητας για τη δημιουργία σημαντικών βιολογικών απειλών ή κυβερνητικών απειλών. Το OpenAi κατέληξε στο συμπέρασμα ότι η απελευθέρωση δεν προωθεί ουσιαστικά τα σύνορα του κινδύνου σε σύγκριση με τα ήδη διαθέσιμα ανοικτά μοντέλα. href=”https://www.theverge.com/2025/8/5/24853399/openai-open-source-models-gpt-oss-meta-china”target=”_ blank”> Στρατηγική απάντηση σε ένα μεταβαλλόμενο τοπίο AI . Η σειρά LLAMA της Meta έχει κυριαρχήσει εδώ και πολύ καιρό στη σκηνή ανοικτού μοντέλου των ΗΠΑ. Πιο πρόσφατα, τα κινεζικά μοντέλα από Deepseek και Alibaba έχουν κερδίσει σημαντική έλξη παγκοσμίως. Στην ανακοίνωσή της, η εταιρεία δήλωσε:”Η ευρεία πρόσβαση σε αυτά τα ικανά μοντέλα ανοικτών βαρών που δημιουργήθηκαν στις ΗΠΑ βοηθά στην επέκταση των δημοκρατικών σιδηροτροχιών AI”. Αυτό το συναίσθημα αντανακλάται από τους αναλυτές. Ο Peter Henderson του Πανεπιστημίου του Πρίνστον σημείωσε ότι”τα ανοιχτά μοντέλα είναι μια μορφή μαλακής δύναμης”, υποδηλώνοντας μια ευρύτερη στρατηγική για τη διατήρηση της αμερικανικής επιρροής στην ανάπτυξη του AI. href=”https://www.technologyreview.com/2025/08/05/1121092/openai-has-finally-released-open-weight-language-models/”target=”_ blank”> σύμφωνα με μία αναφορά . Αυτή η απελευθέρωση ευθυγραμμίζει την εταιρεία με εθνικό ενδιαφέρον για την προώθηση ενός εγχώριου οικοσυστήματος ανοιχτού κώδικα. Ο Nathan Lambert του Ινστιτούτου Allen για την AI επαίνεσε την επιλογή, δηλώνοντας:”Είναι πολύ καλό για την ανοιχτή κοινότητα”. Αυτό έρχεται σε αντίθεση με τις πιο περιοριστικές, προσαρμοσμένες άδειες που χρησιμοποιούνται από ορισμένους ανταγωνιστές και ενθαρρύνει την ευρύτερη υιοθεσία. Είναι αμέσως προσβάσιμοι σε προγραμματιστές παγκοσμίως

Categories: IT Info