OpenAI εισήγαγε την Flex Processing, μια ξεχωριστή βαθμίδα υπηρεσίας API που στοχεύει στους προγραμματιστές που αναζητούν πιο οικονομικούς τρόπους χρήσης των μοντέλων συλλογιστικής O3 και O4-Mini της εταιρείας. Επισήμως ανακοινώθηκε στις 17 Απριλίου 2025, και επί του παρόντος διατίθεται σε beta, αυτή η επιλογή μειώνει σημαντικά το κόστος ανά τζάμι σε σύγκριση με τα πρότυπα ποσοστά API, καθιστώντας το Advanced AI δυνητικά πιο προσιτό για ορισμένες εφαρμογές, αν και έρχεται με αντισταθμίσεις απόδοσης. Το Flex Processing Documentation Σημεία για χρήση περιπτώσεων όπως”Αξιολογήσεις μοντέλων, εμπλουτισμός δεδομένων και ασύγχρονος φόρτος εργασίας”ως ιδανικοί υποψηφίοι. Παρουσιάζεται ως λύση για εργασίες χαμηλότερης προτεραιότητας ή μη παραγωγής, όπου η εξοικονόμηση κόστους υπερβαίνει την ανάγκη για ταχύτητα. Για το μοντέλο O3, οι προγραμματιστές που χρησιμοποιούν το Flex θα πληρώσουν 5 εκατομμύρια δολάρια ανά εκατομμύριο μάρκες εισόδου και $ 20 ανά εκατομμύριο μάρκες παραγωγής, μια απότομη μείωση από τις τυπικές τιμές των $ 10 και $ 40, αντίστοιχα. Παρόμοια μείωση κατά 50%, με τιμή $ 0,55 ανά εκατομμύριο μάρκες εισόδου και 2,20 δολάρια ανά εκατομμύριο μάρκες παραγωγής κάτω από το Flex, σε σύγκριση με τα κανονικά $ 1,10 και $ 4,40. Αυτή η δομή τιμολόγησης ευθυγραμμίζει την Flex με τα ποσοστά που έχουν ήδη καθοριστεί για το API παρτίδας OpenAI, προσφέροντας μια προβλέψιμη δομή κόστους για τους προγραμματιστές να αποδεχθούν ορισμένους περιορισμούς. Η επεξεργασία Flex λειτουργεί σε μια ουρά υπολογισμού χαμηλότερης προτεραιότητας, που σημαίνει ότι οι απαντήσεις API θα λάβουν εγγενώς περισσότερο από τα αιτήματα που γίνονται μέσω της τυπικής βαθμίδας. Μη διαθεσιμότητα .”Εάν το σύστημα δεν διαθέτει επαρκή χωρητικότητα όταν φτάσει ένα αίτημα Flex, θα επιστρέψει έναν κωδικό σφάλματος 429 HTTP. Είναι σημαντικό ότι η OpenAI επιβεβαίωσε ότι οι προγραμματιστές δεν θα χρεώνονται για αιτήματα που αποτυγχάνουν με αυτό το συγκεκριμένο σφάλμα. Για εφαρμογές ανεκτικές σε καθυστερήσεις, συνιστάται η επανάληψη της αίτησης μετά από μια παύση-ενδεχομένως χρησιμοποιώντας εκθετική λογική backoff. Εάν είναι απαραίτητη η έγκαιρη ολοκλήρωση, η επιστροφή στην τυπική βαθμίδα API παραμένει μια επιλογή. Το προεπιλεγμένο χρονικό όριο 10 λεπτών στο επίσημο SDK του OpenAI μπορεί να είναι ανεπαρκές και η εταιρεία προτείνει να αυξήσει αυτό το χρονικό όριο σε ίσως 15 λεπτά για αιτήματα Flex. Για να ενεργοποιήσουν αυτήν την υπηρεσία, οι προγραμματιστές πρέπει να καθορίσουν την παράμετρο `service_tier=”flex”στις κλήσεις API. Ενισχυμένη συλλογιστική και αυτό που ο OpenAI ονομάζεται”πρώιμη συμπεριφορά πρακτικής”. Η επεξεργασία Flex προσφέρει μια διαφορετική, πιο προσιτή πορεία για τους προγραμματιστές να χρησιμοποιούν την ισχύ αυτών των μοντέλων μέσω του API, κατάλληλο για εργασίες backend όπου το κόστος είναι ένα κύριο οδηγό. Η κίνηση του OpenAi για να παρέχει στους προγραμματιστές πιο λεπτομερή έλεγχο του κόστους έναντι της απόδοσης. Αυτή η εκτόξευση ακολουθεί επίσης άλλες πρόσφατες κυκλοφορίες που επικεντρώνονται σε προγραμματιστές από το OpenAI, όπως το εργαλείο CONTEX COLI ανοιχτού κώδικα, το οποίο μπορεί επίσης να αξιοποιήσει τα μοντέλα O3 και O4-Mini. Ενώ το O4-Mini είναι ευρέως διαθέσιμο σε πολλαπλές βαθμίδες (1-5), το πιο ισχυρό μοντέλο O3 γενικά απαιτεί από τους προγραμματιστές να είναι σε υψηλότερες βαθμίδες δαπανών (4 ή 5). Αυτό είναι σύμφωνο με τις αναφερόμενες πολιτικές της OpenAI που αποσκοπούν στη διασφάλιση της χρήσης της υπεύθυνης πλατφόρμας.

Categories: IT Info