Modelul OpenAI GPT-4O câștigă îmbunătățiri de recunoaștere a tulpinilor și a imaginilor, adaugă mai multă utilizare emoji

OpenAI și-a actualizat modelul GPT-4O, îmbunătățindu-și capacitatea de a gestiona întrebările legate de tulpini, de a interpreta datele vizuale și de a încorpora cunoștințe mai recente în răspunsurile sale.

Cea mai recentă actualizare extinde datele de instruire ale modelului din noiembrie 2023 până în iunie 2024, permițându-i să proceseze o gamă mai largă de subiecte actuale, cu o precizie mai mare. Alături de aceste progrese tehnice, OpenAI a ajustat stilul conversațional al modelului prin creșterea utilizării emojis-urilor în interacțiuni casual.

înrudit: cercetătorul de siguranță ex-openai Steven Adler avertizează despre „terifiant” Riscuri în dezvoltarea rapidă AI

Openai spune că GPT-4O demonstrează acum o performanță mai puternică pe reperele AI multimodale, cum ar fi Mathvista și MMMU, care testează capacitatea unui model de a înțelege și analiza atât text, cât și imagini.

Conform OpenAI, modelul rafinat oferă „perspective mai bogate și îndrumări mai precise” atunci când evaluează conținutul vizual, ceea ce îl face mai eficient pentru utilizatorii care lucrează cu diagrame complexe, scheme tehnice și vizualizări de date.

Îmbunătățirile îmbunătățesc, de asemenea, fiabilitatea GPT-4O în câmpurile STEM, o zonă în care modelele AI s-au confruntat istoric, în special cu rezolvarea complexă a problemelor. Motivul conceptual mai bun și competența tehnică. Pentru rezultatele web.

îmbunătățiri ale cunoștințelor STEM și raționamentului logic

GPT-4O oferă acum răspunsuri mai precise la interogări tehnice în matematică, fizică, inginerie, și codificare. Actualizarea îmbunătățește capacitatea modelului de a procesa logica structurată și calcule numerice, domenii în care iterațiile anterioare au produs ocazional rezultate incorecte.

OpenAI a subliniat aceste îmbunătățiri în anunțul său, afirmând: „GPT-4O este acum mai bun la problemele de matematică, știință și legate de codificare, cu câștiguri pe evalii academici precum GPQA și matematică. Scorul său îmbunătățit pe MMLU-un punct de referință cuprinzător al înțelegerii limbajului, al lățimii cunoștințelor și al raționamentului-reflectă capacitatea sa de a aborda probleme mai complexe pe domenii. Rezolvarea problemelor asistată de AI, în special în domenii care necesită precizie, cum ar fi calculul avansat, algoritmii de învățare automată și simulări științifice. sunt centrale pentru câmpuri precum dezvoltarea software-ului și fizica teoretică.

Capabilitățile de raționament îmbunătățite se aliniază lucrărilor continue ale lui OpenAI asupra metodologiilor de lanț de gândire, care permit sistemelor AI să descompună problemele complexe în pași logici mai mici/p>

În timp ce OpenAI nu a afirmat în mod explicit dacă GPT-4O încorporează noi progrese în raționamentul structurat, performanța îmbunătățită a modelului pe GPQA și MMLU sugerează rafinări în modul în care procesează sarcini logice cu mai multe etape.

analiza imaginii mai exactă și înțelegerea multimodală

Actualizarea îmbunătățește, de asemenea, capacitatea GPT-4O de a prelucra imagini, ceea ce îl face un instrument mai capabil pentru analiza relațiilor spațiale, interpretarea diagramelor tehnice și furnizarea Perspective conștiente de context bazate pe intrarea vizuală.

OpenAI a raportat că GPT-4O se ocupă acum mai mare de repere de evaluare multimodală, cum ar fi Mathvista și MMMU, indicând performanțe mai puternice în integrarea raționamentului bazat pe text și vizual.

Openai a explicat aceste îmbunătățiri, Observând că „modelul actualizat este mai adept în interpretarea relațiilor spațiale în încărcările de imagini, precum și analizarea diagramelor complexe, înțelegerea graficelor și graficelor și conectarea intrării vizuale cu conținut scris.”

Capacitatea de a contextualiza și Analizarea datelor vizuale face mai eficient GPT-4O util pentru aplicații în inginerie, arhitectură și știința datelor, unde modelele AI trebuie să proceseze și să interpreteze diagrame sau scheme cu o precizie ridicată.

pentru utilizatorii care lucrează cu desene tehnice detaliate, Blueprints, sau comploturi matematice, aceste îmbunătățiri înseamnă că ChatGPT pot oferi acum informații mai detaliate despre machete spațiale și relații numerice în cadrul datelor vizuale. de imagini, cum ar fi cercetarea științifică, cartografierea geospatială și imagistica medicală.

ajustări conversaționale și utilizarea crescută a emojiului

dincolo de actualizările sale tehnice, Openai s-a ajustat Stilul conversațional al GPT-4O, încorporând mai multă utilizare emoji în răspunsuri. Compania a declarat că modelul va include acum dinamic emoji în interacțiuni, în special atunci când utilizatorii le folosesc deja în mesajele lor.

Openai a recunoscut ajustarea în anunțul său, explicând: „GPT-4O este acum un pic mai entuziast în utilizarea emoji (poate mai ales dacă utilizați emoji în conversație ✨)-anunțați-ne ce vă aflați Gândiți-vă.”

Compania a încurajat utilizatorii să ofere feedback cu privire la faptul dacă utilizarea sporită a emojis-ului îmbunătățește experiența utilizatorului sau ar trebui ajustată în actualizările viitoare.

în timp ce schimbarea legată de emoji Nu are un impact asupra capacităților de raționament ale modelului, semnalează o tendință mai largă pentru a face interacțiunile AI mai naturale și asemănătoare omului. Opțiuni de personalizare pentru tonul conversațional în iterațiile viitoare.

Peisaj competitiv: Deepseek, O3-Mini și Guvern AI

Ultima upgrade GPT-4O ajunge la O perioadă în care Openai se confruntă cu o concurență crescândă din partea dezvoltatorilor Rival AI, în special în domeniile de eficiență și performanță de raționament.

Deepseek, o companie AI din China, a introdus recent modelul R1, care a demonstrat rezultate puternice în raționamentul de referință în timp ce opera pe o fracțiune din resursele de calcul utilizate de modelele Openai.

Abordarea bazată pe eficiență Deepseek a determinat răspunsuri din partea liderilor industriei, inclusiv CEO-ul Openai, Sam Altman, care a recunoscut competiția afirmând: „În mod evident, vom livra modele mult mai bune și, de asemenea, vom crea unele versiuni. p>

înrudit: audit AI-Deepseek nu reușește 83% din testele de precizie din cauza dezinformării și cenzurii

Pe lângă rafinarea GPT-4O cu cea mai recentă actualizare, OpenAI este Pregătirea de a lansa O3-MINI, un model axat pe raționament optimizat pentru viteză și eficiență

Dincolo de AI orientat către consumatori, OpenAI își extinde acoperirea în sectorul public cu Chatgpt Gov, o versiune a modelului său conceput pentru utilizarea agențiilor federale din SUA. 5 (IL5) Standarde de securitate, asigurând respectarea reglementărilor federale.

Modelul este în prezent în curs de acreditare FedRamp, o cerință cheie pentru furnizorii de cloud care lucrează cu agențiile guvernamentale din SUA.

Openai a raportat că peste 90.000 de angajați guvernamentali și Programe pilot timpurii care demonstrează câștiguri de productivitate măsurate. > Cu următoarea undă de avansuri AI la orizont, OpenAI este probabil să se concentreze pe scalarea modelelor sale, asigurând în același timp fiabilitatea în aplicațiile din lumea reală. piață cu diferite strategii de optimizare.

Modelul OpenAI GPT-4O câștigă îmbunătățiri de recunoaștere a tulpinilor și a imaginilor, adaugă mai multă utilizare emoji

Published by All Things Windows on January 30, 2025

îmbunătățiri ale cunoștințelor STEM și raționamentului logic

analiza imaginii mai exactă și înțelegerea multimodală

ajustări conversaționale și utilizarea crescută a emojiului

Peisaj competitiv: Deepseek, O3-Mini și Guvern AI

IT Info

Firele Meta extind caracteristicile media cu fluxuri personalizate, ajunge la 320 de utilizatori

IT Info

Cum să te trezești din somn în program în Windows 11 și 10

IT Info

Cum să verificați versiunea aplicației pe Windows 10

Modelul OpenAI GPT-4O câștigă îmbunătățiri de recunoaștere a tulpinilor și a imaginilor, adaugă mai multă utilizare emoji

Published by All Things Windows on January 30, 2025

îmbunătățiri ale cunoștințelor STEM și raționamentului logic

analiza imaginii mai exactă și înțelegerea multimodală

ajustări conversaționale și utilizarea crescută a emojiului

Peisaj competitiv: Deepseek, O3-Mini și Guvern AI

Related Posts

IT Info

Firele Meta extind caracteristicile media cu fluxuri personalizate, ajunge la 320 de utilizatori

IT Info

Cum să te trezești din somn în program în Windows 11 și 10

IT Info

Cum să verificați versiunea aplicației pe Windows 10