Openai esittelee Flex API: n tarjoamaan halvempaa O3/O4-mini-käyttöä

Openai on tuonut Flex Processing-sovelluksen, erillisen API-palvelutason, jonka tavoitteena on kehittäjät, jotka etsivät taloudellisempia tapoja käyttää yrityksen O3-ja O4-Mini-perustelumalleja. Tämä vaihtoehto julkistetaan virallisesti 17. huhtikuuta 2025 ja tällä hetkellä saatavana beetaversiossa, ja se vähentää huomattavasti tuntemattomia kustannuksia verrattuna tavanomaisten API-korkoihin, mikä tekee edistyksellisestä AI: stä mahdollisesti helpommin tietyille sovelluksille, vaikka sen mukana tulee suorituskyvyn kompromisseja. Flex Processing-dokumentaatio Kohdista käyttämään tapauksia, kuten “mallin arvioinnit, tietojen rikastaminen ja asynkroniset työkuormat”ihanteellisina ehdokkaina. Se esitetään ratkaisuna alhaisemman prioriteetin tai ei-tuotantotyöhön, jossa kustannussäästöt ovat suurempia kuin nopeuden tarve.

FLEX vs.-tavan hinnoittelun

flex-prosessointia verrataan näiden mallien vuorovaikutuksen kustannuksia ohjelmallisesti tarkalleen puoleen. O3-mallissa FLEX-käyttävät kehittäjät maksavat 5 dollaria miljoonaa syöttömerkkiä ja 20 dollaria miljoonaa lähtömerkkejä kohden, vastaavasti 10 dollarin ja 40 dollarin tavanomaisista hinnoista. Samankaltaisen 50%: n alennuksen, jonka hinta on 0,55 dollaria miljoonaa syöttömerkkiä kohti ja 2,20 dollaria miljoonaa dollaria kohti FLEX: llä, verrattuna normaaliin 1,10 dollariin ja 4,40 dollariin. Tämä hinnoittelurakenne kohdistaa joustavan Openain erä-sovellusliittymän jo perustettujen hintojen kanssa, jotka tarjoavat ennustettavan kustannusrakenteen ei-reaaliaikaisten prosessointitehtävien kanssa. Flex-prosessointi toimii alhaisemman prioriteetin laskentajonolla, tarkoittaen API-vastauksia vie luonnostaan kauemmin kuin tavanomaisen tason kautta tehdyt pyynnöt. puuttuminen .”Jos järjestelmästä puuttuu riittävä kapasiteetti, kun Flex-pyyntö saapuu, se palauttaa 429 HTTP-virhekoodin. Tärkeää on, että OpenAi on vahvistanut, että kehittäjiä ei veloiteta pyynnöistä, jotka epäonnistuvat tällä erityisellä virheellä.

näiden ehtojen käsittelemiseksi OpenAi ehdottaa kehittäjien toteuttavan asianmukaista virheenkäsittelyä. Suositellaan viivästyksiä, jotka suvaitsevat viivästyksiä, pyynnön jälkeen tauon jälkeen-mahdollisesti eksponentiaalisesti käyttämällä logiikkaa-suositellaan. Jos oikea-aikainen valmistuminen on välttämätöntä, takaisin vakiona API-tasolle on edelleen vaihtoehto.

-kehittäjien on myös ennakoidaan sovelluslogiikan hitaammat vasteajat; Kymmenen minuutin oletusarvoinen aikakatkaisu Openain virallisissa SDK: issa saattaa olla riittämätön, ja yritys ehdottaa tämän aikakatkaisun kasvattamista ehkä 15 minuuttiin FLEX-pyyntöihin. Tämän palvelun aktivoimiseksi kehittäjien on määritettävä `service_tier=”flex”`-parametri heidän API-puheluissaan.

konteksti: O3/O4-Mini-mallit ja markkinoiden dynamiikka

Tämä uusi hinnoittelutaso sovelletaan erityisesti malleihin, jotka ovat itse avattuja. Esitelty parannettuun päättelyyn ja siihen, mitä Openai kutsui “varhaiseksi agentiseksi käyttäytymiselle”. Flex Processing tarjoaa erilaisen, edullisemman polun kehittäjille näiden mallien voiman avulla API: n kautta, joka sopii taustatehtäviin, joissa kustannukset ovat ensisijainen ohjain.

mallin julkaisun nopea peräkkäisyys ja tämä uusi hinnoittelutaso tulee kilpailukykyisen ympäristön keskellä, jossa leikkuujen AI-mallien käyttämisen kustannukset ovat tärkeitä huomioita, ja RiVals, kuten Google, ovat flex-flash. Ole OpenAi: n siirto tarjota kehittäjille enemmän rakeista hallintaa kustannuksista verrattuna suorituskykyyn. Tämä lanseeraus seuraa myös muita äskettäisiä kehittäjäkeskeisiä julkaisuja OpenAI: lta, kuten avoimen lähdekoodin CODEX CLI-työkalu, joka voi myös hyödyntää O3-ja O4-Mini-malleja. Vaikka O4-MINI on saatavana laajasti useilla tasoilla (1-5), tehokkaampi O3 Tämä on johdonmukaista Openain ilmoittamien politiikkojen kanssa, joiden tarkoituksena on varmistaa vastuullinen alustan käyttö.

Openai esittelee Flex API: n tarjoamaan halvempaa O3/O4-mini-käyttöä

Published by All Things Windows on April 18, 2025

FLEX vs.-tavan hinnoittelun

konteksti: O3/O4-Mini-mallit ja markkinoiden dynamiikka

IT Info

Synologia on asetettu laajentamaan kiintolevyn rajoituksia vuoteen 2025 plus NAS-mallit

IT Info

Openai New O3/O4-Mini-mallit hallusinaatissa enemmän kuin aiemmat mallit

IT Info

DHL pysähtyy arvokkaasti B2C-lähetyksiä meille tullisäännön muutoksissa

Openai esittelee Flex API: n tarjoamaan halvempaa O3/O4-mini-käyttöä

Published by All Things Windows on April 18, 2025

FLEX vs.-tavan hinnoittelun

konteksti: O3/O4-Mini-mallit ja markkinoiden dynamiikka

Related Posts

IT Info

Synologia on asetettu laajentamaan kiintolevyn rajoituksia vuoteen 2025 plus NAS-mallit

IT Info

Openai New O3/O4-Mini-mallit hallusinaatissa enemmän kuin aiemmat mallit

IT Info

DHL pysähtyy arvokkaasti B2C-lähetyksiä meille tullisäännön muutoksissa