OpenAI și-a lansat oficial familia GPT-4.1 Model, introducând trei versiuni noi-GPT-4.1, GPT-4.1 Mini și GPT-4.1 Nano-care urmăresc să echilibreze performanța de top cu costuri și viteză flexibile. Construită pentru a-și depăși predecesorii, seria GPT-4.1 îmbunătățește capacitățile de bază, cum ar fi generarea de coduri, instrucțiunile următoare și raționamentul cu context lung, oferind în același timp o latență mai mică și o utilizare mai consistentă a instrumentelor.

Spre deosebire de GPT-4 și GPT-4O, pe care Power Chatgpt pentru utilizatorii Pro, noile modele sunt disponibile exclusiv prin API-ul OpenAI-se ocupă de concentrarea continuă a companiei asupra integrărilor întreprinderilor și dezvoltatorilor, mai degrabă decât utilizarea chatbot-ului care face față consumatorilor. Prin segmentarea noilor modele în trei niveluri de performanță distincte, OpenAI oferă utilizatorilor API posibilitatea de a se extinde pe baza dimensiunii volumului de muncă și a bugetului. În partea de sus, modelul standard GPT-4.1 este proiectat pentru cele mai complexe aplicații și are un preț în consecință: 2 dolari pe milion de jetoane de intrare și 8 dolari pe milion de jetoane de producție.

GPT-4.1 Mini este o opțiune la sol, care oferă aproape paritate în reperele de informații cu o latență mult mai mică-a scăzut de 0,40 USD pe milion de jetoane de intrare și 1,60 USD la milion de producție. Pentru sarcini ușoare și cazuri de utilizare în timp real, GPT-4.1 Nano este cel mai eficient din punct de vedere al costurilor încă, costă doar 0,10 USD pe milion de jetoane de intrare și 0,40 USD pe milion de jetoane de ieșire.

Fiecare model vine cu compromisuri de performanță, dar Openai susține că chiar și cel mai mic model, nano, oferte anterioare, precum GPT-4O, în mai multe modele, Nano, performanțe anterioare. Aceste adăugări reflectă accentul din ce în ce mai mare al Openai pe a face accesibilă AI-ul generativ într-o gamă mai largă de cazuri de utilizare-de la fluxuri de lucru agentice de înaltă performanță la instrumente încorporate în aplicațiile de consum.

În special, toate cele trei modele împărtășesc aceleași întreruperi de cunoștințe (iunie 2024) și au fost acordate pentru a oferi rezultate mai deterministe, care urmărește formatul decât generațiile anterioare-helping reduce halucinațiile și îmbunătățesc fiabilitatea integrării în medii de producție. apelează nu numai la cercetare și prototipare, ci și la implementarea la scară largă în software comercial, platforme SaaS și sisteme de agenți autonomi. Cu GPT-4.1 poziționat acum ca succesor al previzualizării GPT-4.5 în curând deprecrimat (care se încheie la 14 iulie 2025), Openai clarifică faptul că această generație este de așteptat să poarte greutatea operațională a multora dintre partenerii săi comerciali care vor merge înainte. avansuri notabile asupra predecesorilor lor. Modelul standard GPT-4.1 a obținut un scor de 54,6% pe Swe-bench verificat de referință , marcând o îmbunătățire absolută de 21,4% față de GPT-4O și o îmbunătățire absolută de 21,6%.

În instrucțiunile care urmează, GPT-4.1 a marcat 38,3% pe Benchallenge de scară , reflectând o creștere absolută de 10,5% față de GPT-4O.

Video-mme benchmark Pentru multimodal-context lung, a scăzut 72,0% pe”lungime, nu a subtitrat”​​nu a reușit să se înțeleagă cu o 6.7% în valoare de lungime, în valoare de lungă, GPT-4O.

OpenAI a introdus, de asemenea, două versiuni simplificate: GPT-4.1 Mini și GPT-4.1 Nano. GPT-4.1 Mini oferă o latență și costuri reduse, obținând aproape jumătate din latență și o reducere a costurilor de 83% în comparație cu GPT-4O, în timp ce se potrivește sau depășește performanța GPT-4O în evaluările de informații.

GPT-4.1 Nano, cel mai rapid și cel mai rapid model al lui OpenAI până în prezent, este optimizat pentru sarcini care necesită latență scăzută și eficiență costurilor. Suportă o fereastră de context de până la 1 milion de jetoane și scor 80,1% pe MMLU, 50,3% la GPQA și 9,8% pe valoriile de referință de codificare a poliglotului Aider, depășind exclusivul GPT-4O Mini. Prețul pentru modele este următorul: GPT-4.1 la 2 dolari pe milion de jetoane de intrare și 8 dolari pe milion de jetoane de ieșire; GPT-4,1 mini la 0,40 dolari pe milion de jetoane de intrare și 1,60 USD pe milion de jetoane de producție; și GPT-4.1 Nano la 0,10 dolari pe milion de jetoane de intrare și 0,40 dolari pe milion de jetoane de producție. 

Instrucțiuni îmbunătățite în urma și înțelegerea contextului lung

OpenAI s-a concentrat pe îmbunătățirea capacității modelelor de a urma instrucțiunile și de a înțelege intrările de context lung. Modelele GPT-4.1 sunt concepute pentru a utiliza mai bine ferestre de context ample, sprijinind până la 1 milion de jetoane și să prezinte o înțelegere îmbunătățită a contextului lung. Aceste îmbunătățiri fac ca modelele să fie mai eficiente pentru alimentarea agenților AI capabili să îndeplinească în mod independent sarcini în numele utilizatorilor, cum ar fi inginerie software, analiza documentelor și asistență pentru clienți.

în conformitate cu OpenAI, „Aceste îmbunătățiri ale instrucțiunilor în urma fiabilității și înțelegerea contextului lung fac, de asemenea, GPT-4.1 modele considerabil mai eficiente la agenții alimentari sau sisteme care pot îndeplini în mod independent sarcinile în mod independent pe baza de utilizatori. lățime=”1005″înălțime=”605″src=”date: imagine/svg+xml; nitro-go-id=mtc1ntoxmdq3-1; base64, phn2zyb2awv3qm94psiwidagmtawnsa2md UIIHDPZHROPSIXMDA1IIBOZWLNAHQ9IJYWNSIGEG1SBNM9IMH0DHA6LY93D3CUDZMUB3JNLZIWMDAVC3ZNIJ48L3N2ZZ4=”>

Limitări și considerente ale modelului

În timp ce modelele GPT-4.1 oferă progrese semnificative, OpenAI recunoaște anumite limitări. Modelele pot fi mai literale decât versiunile anterioare, necesitând uneori solicitări mai specifice și explicite din partea utilizatorilor. În plus, precizia modelelor scade pe măsură ce numărul de jetoane de intrare crește; În testele proprii ale lui Openai, precizia a scăzut de la aproximativ 84% cu 8.000 de jetoane la 50% cu 1.024 de jetoane.

OpenAI observă, de asemenea, că GPT-4.1 devine mai puțin fiabil cu atât mai mult token-uri de intrare trebuie să proceseze, subliniind importanța ingineriei prompte și a gestionării contextului în dezvoltarea aplicațiilor. În postarea sa oficială, compania afirmă: „Testerii timpurii au remarcat că GPT-4.1 poate fi mai literal, așa că vă recomandăm să fiți explicit și specific în prompturi. Modelele mai noi au o reducere a cunoștințelor din iunie 2024, oferind dezvoltatorilor acces la mai multe date actuale în comparație cu versiunile anterioare.

Categories: IT Info