OpenAi noong Huwebes ay inilunsad ang GPT-5, ang bagong modelo ng punong barko, na magagamit ito sa lahat ng mga gumagamit ng CHATGPT at mga developer sa buong mundo. Ang paglabas ay nagpapakilala ng isang mas matalinong, mas mabilis, at mas maaasahang modelo na nagtatampok ng isang pinag-isang arkitektura na awtomatikong umaangkop sa pangangatuwiran nito para sa bawat gawain. Naghahatid ito ng mga makabuluhang mga nakuha sa pagganap at drastically binabawasan ang mga makatotohanang mga error na naganap sa mga nakaraang bersyon. Dumating din ito mga araw pagkatapos ng pagbabalik ni Openai sa bukas na mapagkukunan ng mundo kasama ang mga modelo na’gpt-oss`, na nag-sign ng isang bagong diskarte upang mangibabaw ang AI landscape. src=”data: imahe/svg+xml; nitro-empty-id=mty1ndo5nzy=-1; base64, phn2zyB2AWV3QM94PSIWIDAGMTA2OCA1NT Aiihdpzhropsixmdy4iibozwlnahq9iju1mcigeg1sbnm9imh0dha6ly93d3cudzmub3jnlziwmdavc3znij48l3n2zz4=”>
Ang isang pinag-isang sistema na may adaptive na pangangatuwiran
Ang pinakamalaking pagbabago sa GPT-5 ay ang arkitektura nito. Sa halip na hilingin sa mga gumagamit na pumili sa pagitan ng iba’t ibang mga modelo, ang GPT-5 ay nagpapatakbo bilang isang solong, integrated system. Gumagamit ito ng isang sopistikadong real-time na router na pinag-aaralan ang pagiging kumplikado at hangarin ng bawat query. Para sa higit pang mga mapaghamong problema, o kung malinaw na hinihiling ng isang gumagamit na”mag-isip nang husto,”awtomatikong lumipat ang router sa isang mas malalim, mas malakas na modelo ng pangangatuwiran,’GPT-5-pag-iisip`, Ayon sa teknikal na ulat nito . Mga henerasyon, na tinawag ng CEO na si Sam Altman na isang”napaka nakalilito na gulo.”Ang mga tagasuskribi ay nakakakuha ng eksklusibong pag-access sa isang mas malakas na bersyon, `GPT-5 Pro`, na gumagamit ng karagdagang mga mapagkukunan ng computational upang harapin ang mga pinaka-hinihingi na mga katanungan. Tiwala,”Ito ang pinakamahusay na modelo sa mundo sa coding… ang pinakamahusay na modelo sa mundo sa pagsulat, ang pinakamahusay na modelo sa mundo sa pangangalaga sa kalusugan, at isang mahabang listahan ng mga bagay na lampas doon.”
pangingibabaw sa coding at software engineering Sa napatunayan na pagsubok na napatunayan ng tao na napatunayan ng tao, nakamit ng modelo ang isang 74.9% rate ng tagumpay sa unang pagtatangka nito, isang napakalaking pagpapabuti sa 30.8% mula sa GPT-4O at 69.1% mula sa Openai O3. mga gawain. Ang tala ng system card na ito ay isang pangunahing lugar ng pokus, kasama ang modelo na sinanay upang mahawakan ang kumplikadong coding na may kaunting pag-uudyok. Sa GPQA Diamond Benchmark, isang pagsubok ng mga tanong sa science sa antas ng PhD, ang GPT-5 Pro ay umiskor ng 88.4%, bahagyang napapalaki ang Xai’s Grok 4 na mabigat. Sa Benchmark ng Aime 2025 Benchmark ng matematika, nakamit ng GPT-5 Pro ang isang perpektong 100% na marka kapag gumagamit ng isang tagasalin ng Python, at 96.7% nang walang mga tool. Nagpapakita ito ng isang matatag na kakayahan para sa abstract at lohikal na paglutas ng problema na naging matagal nang hamon para sa AI. src=”data: imahe/svg+xml; nitro-empty-id=mty1odo3nzu=-1; base64, phn2zyb2awv3qm94psiwidagmtaxosa1odmi Ihdpzhropsixmde5iibozwlnahq9iju4myigeg1sbnm9imh0dha6ly93d3cudzmub3jnlziwmdavc3znij48l3n2zz4=”>
isang paglukso pasulong sa pagiging maaasahan at katumpakan ng katumpakan
Ang OpenAI ay nakatuon nang labis sa pagbabawas ng mga guni-guni, ang pagkahilig para sa mga modelo upang mag-imbento ng mga katotohanan. Ang mga resulta ay nagpapakita ng isang dramatikong pagbawas sa mga error sa katotohanan sa buong lupon. Kapag pinag-aaralan ang tunay na trapiko ng produksyon ng CHATGPT, ang bagong modelo ay may 78% mas kaunting mga tugon na naglalaman ng hindi bababa sa isang pangunahing error sa katotohanan kumpara sa hinalinhan nito. src=”data: imahe/svg+xml; nitro-empty-id=mty2mjoxmty3-1; base64, phn2zyb2awv3qm94psiwidagmti4mca0mzyi Ihdpzhropsixmjgwiibozwlnahq9ijqzniigeg1sbnm9imh0dha6ly93d3cudzmub3jnlziwmdavc3znij48l3n2zz4=”>
Ang pagpapabuti na ito ay lalo na stark sa mga sensitibong lugar tulad ng pangangalaga sa kalusugan. Sa Healthbench Hard Hallucinations Test, ang GPT-5 ay may rate ng guni-guni na 1.6%lamang, isang pagbawas sa 8x mula sa 12.9%ng O3. Ang pagtaas ng katumpakan na ito ay sentro sa pagtulak ng OpenAi para sa mas mapagkakatiwalaan at kapaki-pakinabang na mga katulong sa AI. src=”data: imahe/svg+xml; nitro-empty-id=mty2ndoxmtgy-1; base64, phn2zyb2awv3qm94psiwidagmti4mca0ndmi Ihdpzhropsixmjgwiibozwlnahq9ijq0myigeg1sbnm9imh0dha6ly93d3cudzmub3jnlziwmdavc3znij48l3n2zz4=”>
pinahusay na kaligtasan at panlilinlang na paglaban
Sa halip na tahasang tumanggi na sagutin ang hindi maliwanag o dual-use query, ang modelo ay sinanay na magbigay ng isang kapaki-pakinabang ngunit ligtas, mataas na antas ng tugon. Nagpapabuti ito ng utility nang hindi nakompromiso sa mga patakaran sa kaligtasan ng pangunahing. Sa malawak na pulang koponan na nakatuon sa marahas na pagpaplano ng pag-atake, ang mga dalubhasa sa tao ay nag-rate ng GPT-5 bilang”mas ligtas”na modelo 65.1% ng oras sa bulag na paghahambing laban sa OpenAI O3. Itinuturo ito ng system card sa bagong pagsasanay sa kaligtasan at mas detalyado, maingat na mga tugon.
Bukod dito, ang modelo ay hindi gaanong madaling kapitan ng panlilinlang. Kapag nasubok sa kakayahang kilalanin at umiwas sa pagsagot sa mga tanong na may maling lugar (hal., Ang pagtatanong tungkol sa isang walang umiiral na imahe), ang rate ng panlilinlang ng GPT-5 ay mas mababa sa 9%, isang dramatikong pagpapabuti sa 87% rate ng openai o3 sa parehong pagsubok. Ang mga top-tier na mga kakayahan sa pangangatuwiran na magagamit sa mga libreng gumagamit ng chatgpt sa unang pagkakataon. Habang ang mga bayad na gumagamit ay makakakuha ng mas mataas na mga limitasyon sa paggamit, ang paglipat na ito ay nag-demokrasya ng pag-access sa state-of-the-art AI.”Ito ay isa lamang sa mga paraan na nasasabik akong mabuhay ang misyon, tinitiyak na ang mga bagay na ito ay talagang nakikinabang sa mga tao.”Ang mga gumagamit ay maaari na ngayong pumili mula sa apat na preset na mga personalidad-nakaukit, robot, nakikinig, at nerd-upang maiangkop ang tono ng chatbot. Papayagan din ng mga bagong pagsasama ang CHATGPT na kumonekta sa Gmail at Google Calendar ng isang gumagamit. Kasama sa pamilya ang pangunahing modelo ng’GPT-5`, isang `GPT-5-mini` para sa mga gawaing sensitibo sa gastos, at isang` GPT-5-Nano` na na-optimize para sa mga aplikasyon ng mababang-latency. Ito ay nagbibilang ng mas maliit na mga open-source na modelo, na may mga bersyon na `mini` at` nano` para sa mga developer na unahin ang bilis at gastos. Nagdaragdag din ang API ng mga bagong kontrol para sa verbosity at pangangatuwiran na pagsisikap, na nagpapahintulot sa pinong pag-tune ng pagganap at latency. Ang paglulunsad ay dumating habang ang OpenAi ay naiulat na nakatingin sa isang $ 500 bilyon na pagpapahalaga at nag-alok ng napakalaking mga bonus upang mapanatili ang talento, na gumagamit ng mga mapagkukunan upang ma-secure ang hinaharap. Tulad ng inilalagay ni Altman,”Ang GPT-5 ay ang unang pagkakataon na talagang nararamdaman ito na makipag-usap sa isang dalubhasa sa antas ng PhD.”Dagdag pa ni Nick Turley,”Ang mga vibes ng modelong ito ay talagang mahusay.”