Setelah melepaskan GPT-5.1 ke CHATGPT, OpenAI telah melancarkan versi model API GPT-5.1, pembaikan utama untuk pemaju yang memberi tumpuan kepada pengekodan dan kecekapan agensi.
Pelancaran ini bertujuan untuk mendapatkan semula kepercayaan pemaju dengan prestasi yang lebih cepat, lebih murah, dan lebih dipercayai selepas pelancaran GPT-5 yang bermasalah pada bulan Ogos. href=”https://openai.com/index/gpt-5-1-for-developer/”target=”_ blank”> Lompat ketara dalam keupayaan . Pelepasan ini bergerak melampaui penjanaan kod mudah ke arah sistem yang lebih autonomi, agentic yang dapat melaksanakan tugas multi-langkah. Sebagai rakan kongsi kerjasama dan bukannya alat pasif.
Pusat API baru adalah dua alat yang direka untuk memberi model lebih banyak kawalan langsung. Alat `Apply_patch` membolehkan GPT-5.1 untuk membuat, mengemas kini, dan memadam fail dalam asas kod menggunakan perbezaan berstruktur.
mesin, membuat gelung pelan pelan untuk tugas seperti pemeriksaan sistem, ujian menjalankan, dan mengumpul data.
Rakan kongsi awal sudah melihat manfaatnya. Denis Shiryaev dari Jetbrains yang dipanggil model baru”benar-benar agenik, model yang paling semulajadi autonomi yang pernah saya uji.”
Sentimen ini disuarakan oleh pemula yang berfokus pada pengekodan. Kod Augment mendapati model”lebih disengajakan dengan tindakan yang lebih sia-sia, penalaran yang lebih cekap, dan tumpuan tugas yang lebih baik,”sementara Cline melaporkan bahawa”GPT-5.1 mencapai SOTA pada penanda aras pengeditan kami dengan peningkatan 7%, menunjukkan kebolehpercayaan yang luar biasa untuk tugas-tugas Fokus pada reka bentuk dan seni bina sistem peringkat tinggi. Pertanyaan mudah mendapat respons yang hampir-hampir, sementara masalah sukar menerima lebih banyak masa”berfikir”untuk memastikan ketepatan. Peruntukan sumber pintar ini direka untuk mengoptimumkan kedua-dua prestasi dan penggunaan token.
Kecekapan ini memberikan hasil yang boleh diukur. Pengurusan Aset Balyasny, pengguna awal, melaporkan bahawa model”mengatasi kedua-dua GPT-4.1 dan GPT-5 dalam suite penilaian dinamik penuh kami, sambil menjalankan 2-3x lebih cepat daripada GPT-5.”Begitu juga, AI insurans BPO mendapati bahawa”ejen kami berjalan’50% lebih cepat pada GPT-5.1 sambil melebihi ketepatan GPT-5 dan model terkemuka lain di seluruh evals kami.'”
Pengekalan cache yang lebih panjang ini boleh mengurangkan kos secara dramatik untuk aplikasi dengan pertanyaan yang kerap, berulang-ulang, dengan token yang dihiasi dengan harga 90% lebih murah daripada yang tidak dicapai . Harga untuk API tetap sama seperti GPT-5. Pelancaran itu sangat bermasalah sehingga Openai terpaksa memulihkan pendahulunya yang popular, GPT-4O, untuk membayar pelanggan. Syarikat kini berusaha untuk membina semula keyakinan dengan platform yang lebih stabil dan berkuasa.
Penanda aras prestasi mencadangkan strategi sedang berfungsi. Pada SWE-Bench untuk pengekodan, GPT-5.1 menjaringkan 76.3%, lompatan ketara dari 72.8%GPT-5. Skor ini juga meletakkannya di hadapan pesaing seperti Anthropic’s Claude 4, yang sebelum ini menjaringkan 72.5% pada penanda aras yang sama. produk chatgpt yang dihadapi pengguna dengan keperibadian”hangat”, pelancaran API ini adalah peristiwa yang berbeza dan lebih penting secara teknikal.