Openai të enjten nisi GPT-5, modelin e tij të ri të flamurit AI, duke e bërë atë të disponueshëm për të gjithë përdoruesit dhe zhvilluesit e ChatGPT globalisht. Lëshimi prezanton një model më të zgjuar, më të shpejtë dhe më të besueshëm që përmban një arkitekturë të unifikuar që përshtat automatikisht arsyetimin e saj për secilën detyrë. Ajo jep fitime të konsiderueshme të performancës dhe zvogëlon në mënyrë drastike gabimet faktike që pllakosën versionet e mëparshme. Ajo gjithashtu vjen vetëm disa ditë pas kthimit të Openai në botën me burim të hapur me modelet e saj `GPT-OSS`, duke sinjalizuar një strategji të re për të mbizotëruar peizazhin e AI. src=”të dhëna: imazh/svg+xml; nitro-impty-id=mty1ndo5nzy=-1; base64, phn2zyb2awv3qm94psiwidagmta2oca1nt Aiihdpzhropsixmdy4iibozwlnahq9iju1mcigeg1sbnm9imh0dha6ly93d3cudzmub3jnlziwmdavc3znij48l3n2zz4=”>
Një sistem i unifikuar me arsyetim adaptiv
Ndryshimi më i madh në GPT-5 është arkitektura e tij. Në vend që t’u kërkoni përdoruesve të zgjedhin midis modeleve të ndryshme, GPT-5 funksionon si një sistem i vetëm, i integruar. Ai përdor një ruter të sofistikuar në kohë reale që analizon kompleksitetin dhe qëllimin e secilës pyetje. Për probleme më sfiduese, ose nëse një përdorues në mënyrë të qartë i kërkon asaj të”mendojë shumë”, ruteri automatikisht kalon në një model arsyetimi më të thellë, më të fuqishëm, `GPT-5-Mendim”, . të cilën CEO Sam Altman më parë e quajti një”rrëmujë shumë konfuze”. Abonentët Pro marrin qasje ekskluzive në një version edhe më të fuqishëm, `GPT-5 Pro`, i cili përdor burime shtesë llogaritëse për të trajtuar pyetjet më të kërkuara. Me siguri,”Ky është modeli më i mirë në botë në kodim… modeli më i mirë në botë në të shkruar, modeli më i mirë në botë në kujdesin shëndetësor, dhe një listë e gjatë e gjërave përtej kësaj.”Në testin e verifikuar të Verifikuar të SWE-së të vlerësuar nga njeriu, modeli arrin një normë suksesi 74.9% në përpjekjen e tij të parë, një përmirësim masiv mbi 30.8% nga GPT-4O dhe 69.1% nga Openai O3. detyrat. Karta e sistemit shënon se kjo është një zonë kryesore e fokusit, me modelin e trajnuar për të trajtuar kodimin kompleks me nxitje minimale. Në standardin e diamantit GPQA, një provë e pyetjeve të shkencës në nivelin e doktoratës, GPT-5 Pro shënoi 88.4%, pak më tej më tejkalon grok 4 të rëndë të Xai.
arsyetimi i tij matematikor është veçanërisht i fortë. Në standardin e matematikës së konkurrencës AIME 2025, GPT-5 Pro arriti një rezultat perfekt 100% kur përdorte një përkthyes Python, dhe 96.7% pa mjete. Kjo tregon një aftësi të fortë për zgjidhjen e problemeve abstrakte dhe logjike që ka qenë një sfidë e gjatë për AI. src=”të dhëna: imazh/svg+xml; nitro-empty-id=mty1odo3nzu=-1; base64, phn2zyb2awv3qm94psiwidagmtaxosa1odmi Ihdpzhropsixmde5iiBozwlnahq9iju4myigeg1sbnm9imh0dha6ly93d3cudzmub3jnlziwmdavc3znij48l3n2zz4=”>
Një kërcim përpara në besueshmërinë dhe saktësinë faktike
Ndoshta përmirësimi më i rëndësishëm për përdoruesit e përditshëm është besueshmëria e përmirësuar e GPT-5. Openai është përqendruar shumë në zvogëlimin e halucinacioneve, tendencën për modelet për të shpikur fakte. Rezultatet tregojnë një ulje dramatike të gabimeve faktike në të gjithë tabelën. Kur analizon trafikun e vërtetë të prodhimit ChatGPT, modeli i ri ka 78% më pak përgjigje që përmbajnë të paktën një gabim të madh faktik në krahasim me paraardhësit e tij. src=”të dhëna: image/svg+xml; nitro-impty-id=mty2mjoxmty3-1; base64, phn2zyb2awv3qm94psiwidagmti4mca0mzyi Ihdpzhropsixmjgwiibozwlnahq9ijqzniigeg1sbnm9imh0dha6ly93d3cudzmub3jnlziwmdavc3znij48l3n2zz4=”>
Ky përmirësim është veçanërisht i ashpër në zona të ndjeshme si kujdesi shëndetësor. Në testin e halucinacioneve të forta të shëndetit, GPT-5 ka një normë halucination prej vetëm 1.6%, një ulje 8x nga 12.9%e O3. Kjo saktësi e rritur është thelbësore për shtytjen e Openai për asistentë më të besueshëm dhe të dobishëm të AI. src=”të dhëna: image/svg+xml; nitro-empty-id=mty2ndoxmtgy-1; base64, phn2zyb2awv3qm94psiwidagmti4mca0ndmi Ihdpzhropsixmjgwiibozwlnahq9ijq0myigeg1sbnm9imh0dha6ly93d3cudzmub3jnlziwmdavc3znij48l3n2zz4=”>
Rezistenca e përmirësuar e sigurisë dhe mashtrimit
Përtej saktësisë, GPT-5 prezanton një sistem sigurie më të nuancuar të quajtur”përfundime të sigurta”. Në vend që të refuzojë plotësisht të përgjigjet në pyetjet e paqarta ose të përdorimit të dyfishtë, modeli është i trajnuar të sigurojë një përgjigje të dobishme, por të sigurt, të nivelit të lartë. Kjo përmirëson shërbimin pa kompromentuar politikat thelbësore të sigurisë.
Modeli është gjithashtu dukshëm më i fortë kundër mashtrimit dhe burgut. Në një ekip të gjerë të kuq u përqëndrua në planifikimin e dhunshëm të sulmit, ekspertët njerëzorë e vlerësuan GPT-5 si modelin”më të sigurt”65.1% të kohës në krahasime të verbër kundër Openai O3. Karta e sistemit ia atribuon këtë trajnimit të ri të sigurisë dhe përgjigjeve më të hollësishme, të kujdesshme. Për më tepër, modeli është më pak i prirur për mashtrim. Kur testohet në aftësinë e tij për të njohur dhe abstenuar nga përgjigjja e pyetjeve me ambiente të rreme (p.sh., duke pyetur për një imazh jo-ekzistent), shkalla e mashtrimit të GPT-5 ishte aq e ulët sa 9%, një përmirësim dramatik mbi normën e 87% të Openai O3 në të njëjtin provë. Aftësitë e arsyetimit të nivelit të lartë në dispozicion për përdoruesit e lirë të chatgpt për herë të parë. Ndërsa përdoruesit e paguar do të marrin kufij më të lartë të përdorimit, kjo lëvizje demokratizon qasjen në AI-në e artit.”Kjo është vetëm një nga mënyrat me të cilat unë jam i entuziazmuar për të jetuar misionin, duke u siguruar që këto gjëra në të vërtetë u sjellin dobi njerëzve.”Përdoruesit tani mund të zgjedhin nga katër personalitete të paracaktuara-Kynic, Robot, Dëgjues dhe Nerd-për të përshtatur tonin e Chatbot. Integrimet e reja gjithashtu do të lejojnë që ChatGPT të lidhet me kalendarin e një përdoruesi Gmail dhe Google. Familja përfshin modelin kryesor `GPT-5`, një` GPT-5-MINI` për detyra të ndjeshme ndaj kostos, dhe një `GPT-5-nano` i optimizuar për aplikime me latencë të ulët.
Kjo qasje e segmentuar është një strategji e qartë për të konkurruar në të gjitha frontet. Ai kundërshton modele më të vogla me burim të hapur, me versione `mini` dhe` nano` për zhvilluesit që i japin përparësi shpejtësisë dhe kostos. API gjithashtu shton kontrolle të reja për verbozitetin dhe përpjekjen e arsyetimit, duke lejuar rregullimin e mirë të performancës dhe latencës. Nisja vjen ndërsa Openai raportohet se po shikon një vlerësim prej 500 miliardë dollarësh dhe ka ofruar shpërblime masive për të mbajtur talentin, duke shfrytëzuar burimet e tij për të siguruar të ardhmen e tij. Siç e thotë Altman,”GPT-5 është hera e parë që me të vërtetë ndjehet sikur po flet me një ekspert të nivelit të doktoratës”. Nick Turley shtoi më thjeshtë,”Vibes e këtij modeli janë vërtet të mira.”