OpenAI har uppdaterat sin GPT-4O-modell och förbättrat dess förmåga att hantera STEM-relaterade frågor, tolka visuella data och integrera nyare kunskap i sina svar.
Den senaste uppdateringen utvidgar modellens träningsdata från november 2023 till juni 2024, vilket gör att den kan bearbeta ett bredare utbud av nuvarande ämnen med större noggrannhet. Vid sidan av dessa tekniska framsteg har OpenAI justerat modellens konversationsstil genom att öka dess användning av emojis i avslappnade interaktioner.
Relaterat: ex-openi-säkerhetsforskare Steven Adler varnar”skrämmande”Risker i snabb AI-utveckling
oena säger att GPT-4o visar nu starkare prestanda på multimodala AI-riktmärken som MathVista och MMMU, som testar en modells förmåga att förstå och analysera både text och bilder.
Enligt OpenAI ger den förfinade modellen”rikare insikter och mer exakt vägledning”vid utvärdering av visuellt innehåll, vilket gör det mer effektivt för användare som arbetar med komplexa diagram, tekniska scheman och datavisualiseringar.
Förbättringarna förbättrar också GPT-4O: s tillförlitlighet inom STEM-fält, ett område där AI-modeller historiskt har mött utmaningar, särskilt med komplex problemlösning. Bättre konceptuella resonemang och tekniska kunskaper. För webbresultat.
Förbättringar i STEM-kunskap och logisk resonemang
GPT-4O ger nu mer exakta svar på tekniska frågor i matematik, fysik, teknik, och kodning. Uppdateringen förbättrar modellens förmåga att bearbeta strukturerad logik och numeriska beräkningar, områden där tidigare iterationer ibland gav felaktiga resultat.
OpenAI betonade dessa förbättringar i sitt tillkännagivande och säger: “GPT-4O är nu bättre på matematik, vetenskap och kodningsrelaterade problem, med vinster på akademiska eVals som GPQA och matematik. Dess förbättrade poäng på MMLU-ett omfattande riktmärke för språkförståelse, kunskapsbredd och resonemang-reflekterar sin förmåga att hantera mer komplexa problem över domäner.”
Dessa uppgraderingar gynnar utvecklare, forskare och studenter som litar på AI-assisterade problemlösning, särskilt i områden som kräver precision såsom avancerad kalkyl, maskininlärningsalgoritmer och vetenskapliga simuleringar. är centrala för fält som mjukvaruutveckling och teoretisk fysik.
De förbättrade resonemangen anpassar sig till Openis pågående arbete med metodikkedja, vilket gör det möjligt för AI-system att dela upp komplexa problem i mindre logiska steg./p>
Medan OpenAI inte uttryckligen anger om GPT-4O innehåller nya framsteg i strukturerade resonemang, föreslår modellens förbättrade prestanda på GPQA och MMLU förfining i hur den bearbetar flerstegs logiska uppgifter.
mer exakt bildanalys och multimodal förståelse
Uppdateringen förbättrar också GPT-4O: s förmåga att bearbeta bilder, göra det till ett mer kapabelt verktyg för att analysera rumsliga relationer, tolka tekniska diagram och tillhandahålla Kontextmedvetna insikter baserade på visuell input.
ouenai rapporterade att GPT-4O nu rankas högre på multimodal utvärderingsriktningar som MathVista och MMMU, vilket indikerar starkare prestanda i att integrera textbaserad och visuell resonemang.
OpenAI förklarade dessa förbättringar, noterar att”den uppdaterade modellen är mer skicklig på att tolka rumsliga relationer i bilduppladdningar, samt analysera komplexa diagram, förstå diagram och grafer och ansluta visuell inmatning med skriftligt innehåll.”
Förmågan att kontextualisera och Analysera visuella data mer effektivt gör GPT-4O användbara för applikationer inom teknik, arkitektur och datavetenskap, där AI-modeller måste bearbeta och tolka diagram eller schema med hög noggrannhet.
för användare som arbetar med detaljerade tekniska ritningar, ritningar, eller matematiska tomter, dessa förbättringar innebär att chatgpt nu kan erbjuda mer detaljerade insikter om rumsliga layouter och numeriska relationer inom visuella data. av bilder, såsom vetenskaplig forskning, geospatial mappning och medicinsk avbildning.
konversationsjusteringar och ökad emoji-användning
Utöver dess tekniska uppgraderingar har OpenAI justerat justerat GPT-4O: s konversationsstil, som innehåller mer emoji-användning i svar. Företaget uppgav att modellen nu kommer att inkludera emojis dynamiskt i interaktioner, särskilt när användare redan använder dem i sina meddelanden.
ouenai erkände justeringen i sitt tillkännagivande och förklarade: “GPT-4O är nu lite mer entusiastisk i sin emoji-användning (kanske särskilt om du använder emoji i konversationen ✨)-låt oss veta vad du Tänk.”
Företaget har uppmuntrat användare att ge feedback om den ökade användningen av emojis förbättrar användarupplevelsen eller bör justeras i framtida uppdateringar.
medan den emoji-relaterade förändringen påverkar inte modellens resonemang, den signalerar en bredare trend mot att göra AI-interaktioner mer naturliga och mänskliga liknande. Anpassningsalternativ för konversationston i framtida iterationer.
Konkurrenslandskap: Deepseek, O3-Mini och Government AI
Den senaste GPT-4O-uppgraderingen anländer till En tid då OpenAI står inför ökande konkurrens från rivaliserande AI-utvecklare, särskilt inom områdena effektivitet och resonemang.
DeepSeek, ett Kina-baserat AI-företag, introducerade nyligen sin R1-modell, som har visat starka resultat i resonemangsreenchmarks när de arbetade på en bråkdel av beräkningsresurserna som används av OpenAI: s modeller.
Deepseeks effektivitetsdrivna strategi har fått svar från branschledare, inklusive OpenAI: s VD Sam Altman, som erkände konkurrensen genom att säga:”Vi kommer uppenbarligen att leverera mycket bättre modeller och också dra upp några utgåvor.”
RELATERADE: AI-revision-Deepseek misslyckas 83% av noggrannhetstesterna på grund av felinformation och censur
Förutom att raffinera GPT-4O med den senaste uppdateringen är OpenAI är Förberedelse för att starta O3-Mini, en resonemangsfokuserad modell optimerad för hastighet och effektivitet.
Utöver konsumentnotering AI utvidgar OpenAI sin räckvidd till den offentliga sektorn med Chatgpt Gov, en version av sin modell utformad för användning av amerikanska federala byråer. 5 (IL5) Säkerhetsstandarder, säkerställer efterlevnad av federala förordningar.
Modellen genomgår för närvarande FedRamp-ackrediteringsprocessen, ett viktigt krav för molnleverantörer som arbetar med amerikanska myndigheter.
Kevin Weil, OpenAI: s chef för produktchef, betonade den potentiella effekten av chatgpt GOV i den offentliga arbetsflödena och säger:”Vi ser en enorm potential för dessa verktyg för att stödja den offentliga sektorn när det gäller att hantera komplexa utmaningar.”
OpenAI rapporterade att mer än 90 000 statliga anställda redan har använt sina AI-verktyg med Tidiga pilotprogram som visar mätbara produktivitetsvinster. > Med nästa våg av AI-framsteg i horisonten kommer OpenAi sannolikt att fokusera på att skala sina modeller samtidigt som tillförlitligheten i verkliga applikationer. Marknad med olika optimeringsstrategier.