Openai on virallisesti käynnistänyt GPT-4.1-malliperheensa esittäen kolme uutta versiota-GPT-4.1, GPT-4.1 mini ja GPT-4,1-nano-, joiden tarkoituksena on tasapainottaa huipputason suorituskykyä joustavilla kustannuksilla ja nopeudella. GPT-4.1-sarja on rakennettu ylittämään edeltäjiensä, ja parantaa ydinominaisuuksia, kuten koodin luomista, ohjeita seuraavia ja pitkän kontekstin päättelyä samalla kun toimitetaan alhaisempi latenssi ja johdonmukaisempi työkalujen käyttö.
Toisin kuin GPT-4 ja GPT-4O, jotka Pro-CHATGPT PRO-käyttäjille, uudet mallit ovat saatavilla yksinomaan OpenAI-sovellusliittymän kautta-yrityksen jatkuvaa keskittymistä yrityksen ja kehittäjien integraatioihin sen sijaan, että kuluttaja-päivitys, vaan myös vuoro OpenAi-alustan strategiassa. Segmentoimalla uudet mallit kolmeen erilliseen suorituskykytasoon, Openai antaa sovellusliittymän käyttäjille kyvyn skaalata työmäärän koon ja budjetin perusteella. Yläosassa tavallinen GPT-4,1-malli on suunniteltu monimutkaisimmille sovelluksille ja se on vastaavasti: 2 dollaria miljoonaa syöttömerkkiä ja 8 dollaria miljoonaa lähtömerkkejä kohti.
GPT-4,1 Mini on keskipisteen vaihtoehto, joka tarjoaa lähellä pariteettiä älykkyyden vertailuarvoissa, joiden latenssi on paljon alhaisempi-hinnoiteltu 0,40 dollaria miljoonalla syöttömerkillä ja 1,60 dollaria miljoonaa dollaria kohti. Kevyiden tehtävien ja reaaliaikaisten käyttötapausten osalta GPT-4,1-nano on vielä kustannustehokkain, kustannukset vain 0,10 dollaria miljoonasta syöttömerkistä ja 0,40 dollaria miljoonasta lähtömerkeistä. Nämä lisäykset heijastavat Openain kasvavaa painotusta generatiivisen AI: n saavuttamiseen laajemmassa käyttötapauksessa-korkean suorituskyvyn agenttisista työnkulkuista upotettuihin työkaluihin kuluttajasovelluksissa.
Erityisesti kaikilla kolmella mallilla on sama tiedon katkaisu (kesäkuu 2024), ja ne on viritetty toimittamaan deterministisempiä, muodon seuraavia lähtöjä kuin aikaisemmat sukupolvet-vähentämään hallusinaatioita ja parantamaan integraation luotettavuutta tuotantoympäristöissä. vetoaa paitsi tutkimukseen ja prototyyppiin, myös korkean mittaisen käyttöönoton kaupallisiin ohjelmistoihin, SaaS-alustoihin ja autonomisiin agenttijärjestelmiin. Kun GPT-4.1 on nyt sijoitettu pian vähentävän GPT-4.5-esikatselun seuraajaksi (päättyen 14. heinäkuuta 2025), Openai tekee selväksi, että tämän sukupolven odotetaan kantavan monien kaupallisten kumppaneidensa toiminnan painoa. Edistyksiä edeltäjiinsä nähden. Tavallinen GPT-4.1-malli saavutti pistemäärän 54,6% Swe-Bench todennettu vertailukohta , merkitseen 21,4%: n absoluuttisen parannuksen GPT-4O: n ja 26,6%: n absoluuttisen parannuksen suhteen.
Ohjeessa seuraavan ohjeen GPT-4.1 sai 38,3% Scale’s Multichallenge-vertailuarvo , heijastaen 10,5%: n absoluuttista kasvua GPT-4O: sta.
Lisäksi GPT-4.1 asetti uuden tilan tuloksen Video-MME-vertailukohta Multimodaalisille pitkän-contekstin ymmärrykselle, 72,0%: lla”pitkillä, ei subitles”-luokassa. GPT-4O. GPT-4,1 Mini tarjoaa vähentyneen viivettä ja kustannuksia, saavuttaen lähes puolet viiveen ja 83%: n kustannusten vähentämisen verrattuna GPT-4O: hon, samalla kun se vastaa tai ylittää GPT-4O: n suorituskykyä älykkyyden arvioinnissa.
GPT-4.1 Nano, Openain pienin ja nopein malli tähän mennessä, on optimoitu tehtäviin, jotka vaativat alhaisen viivettä ja kustannustehokkuutta. Se tukee enintään miljoonan merkin kontekstiikkunaa ja pisteet 80,1% MMLU: lla, 50,3% GPQA: lla ja 9,8% Aider Polyglot-koodausvertailuarvoilla, ylittäen GPT-4O MINI: n suorituskyvyn.
Nämä mallit ovat saatavilla yksinomaan Openain API: n kehittämisessä. Mallien hinnoittelu on seuraava: GPT-4,1 ja 2 dollaria miljoonaa syöttömerkkiä ja 8 dollaria miljoonaa lähtömerkkejä kohti; GPT-4,1 MINI on 0,40 dollaria miljoonaa syöttömerkkiä ja 1,60 dollaria miljoonaa kohti lähtömerkit; ja GPT-4,1-nano 0,10 dollaria miljoonalla syöttömerkillä ja 0,40 dollaria miljoonalle lähtömerkille.
Parannettu ohjeet Seuraava ja pitkän kontekstin ymmärtäminen
OpenAI on keskittynyt mallien kykyyn noudattaa ohjeita ja ymmärtää pitkien kontekstin tuloja. GPT-4.1-mallit on suunniteltu hyödyntämään paremmin laajoja kontekstiikkunoita, jotka tukevat jopa miljoona merkkiä, ja niillä on parannettu pitkän kontekstin ymmärtämistä. Nämä parannukset tekevät malleista tehokkaampia AI-agenttien voimistamiseen, jotka kykenevät itsenäisesti suorittamaan tehtäviä käyttäjien puolesta, kuten ohjelmistotekniikka, asiakirjojen analysointi ja asiakastuki.
OpenAI: n mukaan “Nämä parannukset luotettavuuden ja pitkän kontekstin ymmärtämisen jälkeen myös GPT-4.1-mallit ovat huomattavasti tehokkaampia käyttäjille.
mallirajoitukset ja näkökohdat
Vaikka GPT-4.1-mallit tarjoavat merkityksellisiä edistysaskeleita, OpenAI tunnustaa tietyt rajoitukset. Mallit voivat olla kirjaimellisempia kuin aiemmat versiot, jotka joskus vaativat käyttäjien tarkempia ja nimenomaisia kehotuksia. Lisäksi mallien tarkkuus vähenee, kun syöttömerkkien lukumäärä kasvaa; Openain omissa testeissä tarkkuus laski noin 84%: sta 8000 rahakkeella 50%: iin 1 024 rahakkeella.
Openai toteaa myös, että GPT-4,1: stä tulee vähemmän luotettavampaa, mitä enemmän syöttömerkkejä sen on käsiteltävä, korostaen nopean tekniikan ja kontekstinhallinnan merkitystä sovelluksen kehittämisessä. Yhtiö toteaa virallisessa viestissään “varhaiset testaajat totesivat, että GPT-4,1 voi olla kirjaimellisempi, joten suosittelemme olevan nimenomaisia ja erityisiä kehotuksissa.”Uudemmilla malleilla on tiedon katkaisu kesäkuussa 2024, mikä antaa kehittäjille pääsyn nykyiseen tietoon aikaisempiin versioihin verrattuna.