OpenAI lansează serii de model GPT-5 cu raționament îmbunătățit, codificare și abilități de scriere și halucinații drastic mai mici

OpenAI a lansat joi GPT-5, noul său model AI-pilot, ceea ce îl pune la dispoziția tuturor utilizatorilor și dezvoltatorilor ChatGPT la nivel mondial. Versiunea introduce un model mai inteligent, mai rapid și mai fiabil, cu o arhitectură unificată care își adaptează automat raționamentul pentru fiecare sarcină.

Această mișcare strategică are ca scop simplificarea experienței utilizatorului și restabilirea conducerii lui OpenAI pe piața AI competitivă. Oferă câștiguri semnificative de performanță și reduce drastic erorile de fapt care au afectat versiunile anterioare.

Lansarea este un moment critic pentru companie, după o perioadă de concurență intensă și recepția neplăcută a GPT-4.5. De asemenea, vine la doar câteva zile după întoarcerea lui Openai în lumea open-source cu modelele sale „GPT-OSS”, semnalând o nouă strategie pentru a domina peisajul AI.

Un sistem unificat cu raționament adaptiv

cea mai mare schimbare în GPT-5 este arhitectura sa. În loc să ceară utilizatorilor să aleagă între diferite modele, GPT-5 funcționează ca un sistem unic, integrat. Utilizează un router sofisticat în timp real, care analizează complexitatea și intenția fiecărei interogări.

Pentru majoritatea întrebărilor, se bazează pe un model de bază rapid și eficient numit „GPT-5-Main”. Pentru probleme mai provocatoare sau dacă un utilizator îi cere în mod explicit să „gândească din greu”, routerul trece automat la un model de raționament mai profund, mai puternic, `GPT-5-gândire’, Conform raportului său tehnic . Care CEO Sam Altman a numit anterior o „mizerie foarte confuză”. Pro subscribers get exclusive access to an even more powerful version, `GPT-5 Pro`, which uses additional computational resources to tackle the most demanding questions.

Setting New Benchmarks in Performance and Accuracy

OpenAI claims GPT-5 re-establishes it as the clear industry leader, backing this up with impressive benchmark results from its official System Card CEO Sam Altman stated În mod încrezător, „Acesta este cel mai bun model din lume la codificare… Cel mai bun model din lume la scris, cel mai bun model din lume la îngrijirea sănătății și o lungă listă de lucruri dincolo de asta. La testul verificat SWE-Bench-Bench-Bench, modelul atinge o rată de succes de 74,9% la prima sa încercare, o îmbunătățire masivă față de 30,8% de la GPT-4O și 69,1% de la OpenAI O3.

Acest scor a bătut în mod restrâns cel mai recent Claude Opus 4.1 și FAR care depășește noul stat GEMINI pentru software-ul GEMINI pentru software-ul Google, care poziționează GPT-5, ca noul stat de la Google-GEMINI pentru software-ul Google 2,5 Pro, poziționând GPT-5, ca noul stat-GEMINI pentru Google, pentru a poziționa GPT-5, ca nou, ca noul stat GEMINI pentru software-ul Google. sarcini de inginerie. Cardul de sistem notează că aceasta este o zonă de focalizare cheie, modelul instruit să se ocupe de codificarea complexă cu o solicitare minimă.

Excelând la provocări academice la nivel de experți

Modelul excelează, de asemenea, în domenii academice extrem de specializate, care necesită cunoștințe profunde la nivel de expert. Pe referința GPQA Diamond, un test al întrebărilor științifice la nivel de doctorat, GPT-5 Pro a obținut 88,4%, depășind ușor Grok 4 Heavy.

raționamentul său matematic este deosebit de puternic. Pe referința de matematică a competiției AIME 2025, GPT-5 Pro a obținut un scor perfect de 100% atunci când a utilizat un interpret Python și 96,7% fără instrumente. Acest lucru demonstrează o capacitate robustă pentru rezolvarea problemelor abstracte și logice, care a fost o provocare de lungă durată pentru AI.

Un salt înainte în fiabilitate și precizie factuală

Poate că cea mai semnificativă îmbunătățire pentru utilizatorii de zi cu zi este fiabilitatea îmbunătățită a GPT-5. OpenAI s-a concentrat puternic pe reducerea halucinațiilor, tendința modelelor de a inventa fapte. Rezultatele arată o reducere dramatică a erorilor de fapt de-a lungul bordului.

conform cardului de sistem `GPT-5-gândire` face de peste cinci ori mai puține erori de fapt decât OpenAI O3 pe valori de referință open-source precum Longfact și Factscore. Atunci când analizează traficul de producție chatgpt real, noul model are cu 78% mai puține răspunsuri care conțin cel puțin o eroare de fapt majoră în comparație cu predecesorul său.

Această îmbunătățire este deosebit de accentuată în zone sensibile, cum ar fi asistența medicală. La testul de halucinații grele pentru Healthbench, GPT-5 are o rată de halucinație de doar 1,6%, o reducere de 8x de la 12,9%din O3. Această precizie crescută este centrală pentru o presiune a lui Openai pentru asistenți AI mai de încredere și utili.

Rezistență îmbunătățită de siguranță și înșelăciune

Dincolo de precizie, GPT-5 introduce un sistem de siguranță mai nuanțat numit „completări sigure”. În loc să refuze în mod clar să răspundă la întrebări ambigue sau cu dublă utilizare, modelul este instruit pentru a oferi un răspuns util, dar sigur, la nivel înalt. Acest lucru îmbunătățește utilitatea fără a compromite politicile de siguranță de bază.

Modelul este, de asemenea, semnificativ mai robust împotriva înșelăciunii și a jailbreak-urilor. În cadrul unei echipe roșii extinse s-au concentrat pe planificarea atacurilor violente, experții umani au evaluat GPT-5 ca modelul „mai sigur” 65,1% din timp în comparații oarbe împotriva Openai O3. Cardul de sistem atribuie acest lucru noii instruiri de siguranță și răspunsurilor mai detaliate, prudente.

Mai mult, modelul este mai puțin predispus la înșelăciune. Atunci când a fost testat pe capacitatea sa de a recunoaște și de a se abține să răspundă la întrebări cu premise false (de exemplu, întrebarea despre o imagine inexistentă), rata de înșelăciune a GPT-5 a fost de până la 9%, o îmbunătățire dramatică față de rata de 87% a Openai O3 în același test. își pune la dispoziție capacitățile de raționament de top pentru utilizatorii ChatGPT gratuite pentru prima dată. În timp ce utilizatorii plătiți vor primi limite de utilizare mai mari, această mișcare democratizează accesul la AI-ul de ultimă generație

Nick Turley, VP de ChatGPT al lui Openai, a declarat că decizia reflectă principiile de bază ale companiei. „Acesta este doar unul dintre modalitățile prin care sunt încântat să trăiesc misiunea, asigurându-mă că aceste lucruri beneficiază de fapt oamenii. Utilizatorii pot alege acum dintre patru personalități prestabilite-Cinici, robot, ascultător și tocilar-pentru a adapta tonul chatbotului. Noile integrări vor permite, de asemenea, ChatGPT să se conecteze la Gmail și Google Calendar al unui utilizator.

O strategie segmentată pentru dezvoltatori și întreprindere

Pentru dezvoltatori și întreprinderi, GPT-5 este lansat printr-o API cu o structură nivelată concepută pentru a satisface diferite nevoi. Familia include principalul model `GPT-5`, un` GPT-5-MINI` pentru sarcini sensibile la costuri și un `GPT-5-nano` optimizat pentru aplicații cu latență scăzută.

Această abordare segmentată este o strategie clară pentru a concura pe toate fronturile. Controlează modele mai mici open-source, cu versiuni Mini` și `nano` pentru dezvoltatorii care acordă prioritate vitezei și costurilor. API-ul adaugă, de asemenea, noi controale pentru efortul de verbositate și raționament, permițând reglarea fină a performanței și latenței.

Prețurile pentru modelul de bază `GPT-5` este stabilit la 1,25 USD pe milion de jetoane de intrare și 10 dolari pe milion pentru ieșire. Lansarea vine în condițiile în care OpenAI se presupune că o evaluare de 500 de miliarde de dolari și a oferit bonusuri masive pentru a-și păstra talentul, folosind resursele sale pentru a-și asigura viitorul. După cum spune Altman, „GPT-5 este prima dată când se simte într-adevăr ca să vorbești cu un expert la nivel de doctorat”. Nick Turley a adăugat mai simplu: „Vibrările acestui model sunt foarte bune.”

OpenAI lansează serii de model GPT-5 cu raționament îmbunătățit, codificare și abilități de scriere și halucinații drastic mai mici

Published by All Things Windows on August 7, 2025

Un sistem unificat cu raționament adaptiv

Setting New Benchmarks in Performance and Accuracy

Excelând la provocări academice la nivel de experți

Un salt înainte în fiabilitate și precizie factuală

Rezistență îmbunătățită de siguranță și înșelăciune

O strategie segmentată pentru dezvoltatori și întreprindere

IT Info

Cum să verificați dacă dispozitivul dvs. Windows 11 acceptă Miracast

IT Info

Setări de cercetare de securitate: Cum să dezactivați sau să porniți

IT Info

SoftBank confirmă întârzieri Stargate, reporniți proiectul AI de 500 miliarde de dolari cu achiziția de plante din Ohio

OpenAI lansează serii de model GPT-5 cu raționament îmbunătățit, codificare și abilități de scriere și halucinații drastic mai mici

Published by All Things Windows on August 7, 2025

Un sistem unificat cu raționament adaptiv

Setting New Benchmarks in Performance and Accuracy

Excelând la provocări academice la nivel de experți

Un salt înainte în fiabilitate și precizie factuală

Rezistență îmbunătățită de siguranță și înșelăciune

O strategie segmentată pentru dezvoltatori și întreprindere

Related Posts

IT Info

Cum să verificați dacă dispozitivul dvs. Windows 11 acceptă Miracast

IT Info

Setări de cercetare de securitate: Cum să dezactivați sau să porniți

IT Info

SoftBank confirmă întârzieri Stargate, reporniți proiectul AI de 500 miliarde de dolari cu achiziția de plante din Ohio