Ang
OpenAI ay naglunsad ng GPT-5, ang pinakamalakas at nakatuon na nakatuon na modelo ng AI na pamilya hanggang ngayon. Inilabas noong Huwebes sa pamamagitan ng API nito, ang bagong modelo ng punong barko ay naghahatid ng pagganap ng state-of-the-art sa coding, paggamit ng tool, at kumplikadong pangangatuwiran. Ang paglulunsad ay naglalayong muling maitaguyod ang pamumuno ng OpenAi sa pamamagitan ng pagbibigay ng mga developer ng isang mas may kakayahang, maaasahan, at mahusay na AI. Ang tiered na diskarte na ito ay isang direktang tugon sa isang lalong mapagkumpitensyang merkado, na tinutugunan ang mga pangangailangan ng developer mula sa mga high-end na gawain ng ahente hanggang sa mga operasyon na mababa ang latency. Nagpapirma ito ng isang malinaw na hangarin na makuha ang buong merkado ng developer. (Sota) talaan Sa ilang mga pangunahing benchmark ng developer. Ang modelo ay umiskor ng 74.9% sa SWE-Bench na na-verify, isang pagsubok na nangangailangan ng isang AI upang malutas ang mga isyu sa real-world software. Kapansin-pansin, nakamit ito ng 22% mas kaunting mga token ng output kaysa sa hinalinhan nito.
Ang paglukso sa kasanayan sa coding ay isang pangunahing pokus ng pagpapalaya. Sa benchmark ng Polyglot ng Aider, na sinusuri ang pag-edit ng code ng multi-wika, nakamit ng GPT-5 ang isang record na 88% na rate ng tagumpay. Ito ay kumakatawan sa isang makabuluhang pagbawas sa mga pagkakamali kumpara sa mga nakaraang modelo at mga kakumpitensya tulad ng Claude ng Anthropic 4.1 opus. Sa kamakailan-lamang na nai-publish na τ²-bench telecom benchmark, ang GPT-5 ay nakapuntos ng isang pambihirang 96.7%, na ipinapakita ang mga advanced na tool-calling at ahente na kakayahan. Pinuri ni Vercel ang modelo, na nagsasabi ng”Ito ang pinakamahusay na modelo ng Frontend AI, na pumipigil sa tuktok na pagganap sa parehong pang-aesthetic na kahulugan at ang kalidad ng code, inilalagay ito sa isang kategorya ng sarili nitong.”Katulad nito, natagpuan ng platform ng pag-edit ng code na si Cursor ang modelo na”kamangha-manghang matalino, madaling patnubayan, at kahit na may pagkatao [hindi nila nakita sa ibang mga modelo.”Iniulat din ng Windsurf na ang modelo ay”may kalahati ng rate ng error sa pagtawag sa tool sa iba pang mga modelo ng hangganan,”isang kritikal na sukatan para sa maaasahang automation.
granular control para sa naangkop na mga tugon ng API
Ang bagong parameter ng pangangatuwiran_effort ay nagbibigay-daan sa mga developer na pamahalaan ang trade-off sa pagitan ng kalidad ng tugon at bilis, na may isang setting na’minimal` para sa malapit na mga sagot. Ang isang bagong parameter ng verbosity ay tumutulong din na pamahalaan ang haba ng mga tugon, ang pagtiyak ng mga output ay naaangkop na maigsi o komprehensibo para sa tiyak na kaso ng paggamit nang walang kumplikadong engineering. Ang tampok na ito ay nagbibigay-daan sa mga developer na tukuyin ang mga tool gamit ang simpleng plaintext, sa pamamagitan ng pag-iwas sa pangangailangan para sa mahigpit na pag-format ng JSON. Ang pagbabagong ito ay idinisenyo upang mabawasan ang mga pagkakamali, lalo na kung ang pagpasa ng mga malalaking bloke ng code o teksto na nangangailangan ng maingat na pagtakas ng character. Ang punong barko ng GPT-5 ay naka-presyo sa $ 1.25 bawat milyong mga token ng input at $ 10.00 para sa output. Ito ang posisyon bilang pagpipilian ng mataas na pagganap para sa hinihingi na mga aplikasyon. Sa pinaka-naa-access na tier, ang GPT-5-Nano ay na-optimize para sa mga kaso ng paggamit ng mababang-latency, na naka-presyo sa $ 0.05 lamang para sa pag-input at $ 0.40 para sa mga output token, na direktang nakikipagkumpitensya sa mas maliit na mga modelo ng open-source. Nagbibigay ito ng isang malinaw na landas para sa mga developer upang masukat ang kanilang mga aplikasyon batay sa mga kinakailangan sa pagganap at mga hadlang sa badyet, tinitiyak na ang OpenAI ay may alok para sa bawat segment ng merkado. Iniulat ng OpenAi na ang modelo ay gumagawa ng humigit-kumulang na 80% mas kaunting mga pagkakamali sa katotohanan kaysa sa hinalinhan nito sa mga benchmark tulad ng Longfact at Factscore, isang mahalagang pagpapabuti para sa pagbuo ng maaasahang mga aplikasyon. Ang feedback mula sa mga tester ng negosyo tulad ni Manus ay kinukumpirma ito, kasama ang isang tagapagsalita na nagsasabing ang modelo ay”nakamit ang pinakamahusay na pagganap [na] nakita nila mula sa isang solong modelo sa [kanilang] panloob na mga benchmark.”
Ang pinabuting pangangatuwiran na ito ay kritikal para sa pag-aampon ng negosyo, kung saan dapat magbigay ng AI ang mapagkakatiwalaan at matalinong mga output para sa mga kumplikadong problema sa negosyo. Ang GPT-5 ay isinama na sa mga platform ng Microsoft, kasama ang Azure AI at Github Copilot. Tinitiyak nito ang agarang pagkakaroon para sa isang napakalaking base ng developer at pinapatibay ang papel nito sa ecosystem ng negosyo.