Openai on tuonut Flex Processing-sovelluksen, erillisen API-palvelutason, jonka tavoitteena on kehittäjät, jotka etsivät taloudellisempia tapoja käyttää yrityksen O3-ja O4-Mini-perustelumalleja. Tämä vaihtoehto julkistetaan virallisesti 17. huhtikuuta 2025 ja tällä hetkellä saatavana beetaversiossa, ja se vähentää huomattavasti tuntemattomia kustannuksia verrattuna tavanomaisten API-korkoihin, mikä tekee edistyksellisestä AI: stä mahdollisesti helpommin tietyille sovelluksille, vaikka sen mukana tulee suorituskyvyn kompromisseja. Flex Processing-dokumentaatio Kohdista käyttämään tapauksia, kuten “mallin arvioinnit, tietojen rikastaminen ja asynkroniset työkuormat”ihanteellisina ehdokkaina. Se esitetään ratkaisuna alhaisemman prioriteetin tai ei-tuotantotyöhön, jossa kustannussäästöt ovat suurempia kuin nopeuden tarve.
FLEX vs.-tavan hinnoittelun
flex-prosessointia verrataan näiden mallien vuorovaikutuksen kustannuksia ohjelmallisesti tarkalleen puoleen. O3-mallissa FLEX-käyttävät kehittäjät maksavat 5 dollaria miljoonaa syöttömerkkiä ja 20 dollaria miljoonaa lähtömerkkejä kohden, vastaavasti 10 dollarin ja 40 dollarin tavanomaisista hinnoista. Samankaltaisen 50%: n alennuksen, jonka hinta on 0,55 dollaria miljoonaa syöttömerkkiä kohti ja 2,20 dollaria miljoonaa dollaria kohti FLEX: llä, verrattuna normaaliin 1,10 dollariin ja 4,40 dollariin. Tämä hinnoittelurakenne kohdistaa joustavan Openain erä-sovellusliittymän jo perustettujen hintojen kanssa, jotka tarjoavat ennustettavan kustannusrakenteen ei-reaaliaikaisten prosessointitehtävien kanssa. Flex-prosessointi toimii alhaisemman prioriteetin laskentajonolla, tarkoittaen API-vastauksia vie luonnostaan kauemmin kuin tavanomaisen tason kautta tehdyt pyynnöt. puuttuminen .”Jos järjestelmästä puuttuu riittävä kapasiteetti, kun Flex-pyyntö saapuu, se palauttaa 429 HTTP-virhekoodin. Tärkeää on, että OpenAi on vahvistanut, että kehittäjiä ei veloiteta pyynnöistä, jotka epäonnistuvat tällä erityisellä virheellä.
näiden ehtojen käsittelemiseksi OpenAi ehdottaa kehittäjien toteuttavan asianmukaista virheenkäsittelyä. Suositellaan viivästyksiä, jotka suvaitsevat viivästyksiä, pyynnön jälkeen tauon jälkeen-mahdollisesti eksponentiaalisesti käyttämällä logiikkaa-suositellaan. Jos oikea-aikainen valmistuminen on välttämätöntä, takaisin vakiona API-tasolle on edelleen vaihtoehto.
-kehittäjien on myös ennakoidaan sovelluslogiikan hitaammat vasteajat; Kymmenen minuutin oletusarvoinen aikakatkaisu Openain virallisissa SDK: issa saattaa olla riittämätön, ja yritys ehdottaa tämän aikakatkaisun kasvattamista ehkä 15 minuuttiin FLEX-pyyntöihin. Tämän palvelun aktivoimiseksi kehittäjien on määritettävä `service_tier=”flex”`-parametri heidän API-puheluissaan.
konteksti: O3/O4-Mini-mallit ja markkinoiden dynamiikka
Tämä uusi hinnoittelutaso sovelletaan erityisesti malleihin, jotka ovat itse avattuja. Esitelty parannettuun päättelyyn ja siihen, mitä Openai kutsui “varhaiseksi agentiseksi käyttäytymiselle”. Flex Processing tarjoaa erilaisen, edullisemman polun kehittäjille näiden mallien voiman avulla API: n kautta, joka sopii taustatehtäviin, joissa kustannukset ovat ensisijainen ohjain.
mallin julkaisun nopea peräkkäisyys ja tämä uusi hinnoittelutaso tulee kilpailukykyisen ympäristön keskellä, jossa leikkuujen AI-mallien käyttämisen kustannukset ovat tärkeitä huomioita, ja RiVals, kuten Google, ovat flex-flash. Ole OpenAi: n siirto tarjota kehittäjille enemmän rakeista hallintaa kustannuksista verrattuna suorituskykyyn. Tämä lanseeraus seuraa myös muita äskettäisiä kehittäjäkeskeisiä julkaisuja OpenAI: lta, kuten avoimen lähdekoodin CODEX CLI-työkalu, joka voi myös hyödyntää O3-ja O4-Mini-malleja. Vaikka O4-MINI on saatavana laajasti useilla tasoilla (1-5), tehokkaampi O3 Tämä on johdonmukaista Openain ilmoittamien politiikkojen kanssa, joiden tarkoituksena on varmistaa vastuullinen alustan käyttö.