Mengikuti peluncuran turbulen dari model GPT-5-nya, Openai sedang menguji fitur”upaya berpikir”baru untuk chatgpt yang memberi pengguna lebih banyak kontrol granular atas kinerja AI. Terlihat pada akhir Agustus, pengaturan eksperimental memungkinkan pengguna untuk memilih dari empat tingkat intensitas komputasi.
Langkah ini merupakan respons langsung terhadap kritik luas yang merusak peluncuran GPT-5, yang mendorong perusahaan untuk mengembalikan model GPT-4O yang populer dan menambah kontrol manual. Dengan membiarkan pengguna menyeimbangkan kecepatan respons terhadap kedalaman analitik, OpenAI bertujuan untuk mengatasi masalah keandalan dan meningkatkan pengalaman pengguna.
dari peluncuran yang berantakan ke kontrol manual
Visi asli OpenAi untuk GPT-5, yang diluncurkan pada 7 Agustus, adalah sistem terpadu yang secara otomatis memilih internal secara otomatis di internal. Tujuannya adalah untuk menghilangkan apa yang disebut CEO Sam Altman sebagai”kekacauan membingungkan”dari berbagai model. Namun, strategi ambisius dengan cepat terurai.
Pengguna mendokumentasikan kaskade bug bizarre dan kesalahan faktual. Model ini menemukan nama-nama negara fiksi seperti”Onegon,”gagal pada matematika dasar, dan menghasilkan output yang tidak masuk akal, yang mengarah ke reaksi luas. Resepsi publik sangat negatif sehingga perusahaan dipaksa menjadi postur defensif yang langka.
Pada 8 Agustus, Altman mengeluarkan permintaan maaf publik. Dia mengakui bahwa”‘autoswitcher’yang salah antara mode internal model telah membuatnya untuk waktu yang lebih lama’tampak jauh lebih bodoh’daripada yang dimaksudkan,”menyalahkan cacat teknis untuk kinerja yang buruk. Tersandung ini memberikan amunisi bagi para kritikus dan menciptakan pembukaan untuk saingan, yang dengan cepat memanfaatkan situasi tersebut.
Hanya beberapa hari kemudian, pada 12 Agustus, OpenAI mengeksekusi pembalikan yang signifikan. Ini memulihkan GPT-4O untuk membayar pelanggan dan memperkenalkan mode manual untuk GPT-5:”Otomatis,””Cepat,”dan”Berpikir”. Pivot ini menandakan pelajaran besar bagi pemimpin AI tentang menyeimbangkan inovasi dengan harapan pengguna.
Fitur”upaya berpikir”baru tampaknya menjadi evolusi yang lebih granular dari koreksi kursus itu. Altman sendiri mengisyaratkan pergeseran ini, menyatakan, “Satu belajar untuk kita dari beberapa hari terakhir adalah kita benar-benar hanya perlu sampai ke dunia dengan lebih banyak penyesuaian kepribadian model yang lebih banyak.”
VP Openai dari ChatGPT, Nick Turley, AKU AME RIDEATIF, “Kami tidak selalu akan mendapatkan segalanya pada TREYS, AKURNAGE PERUBAHAN, AM AM SANGAT MENGATAKAN,“ Kami tidak selalu akan mendapatkan segalanya pada TRIM, AKURNING How the ITerative, “Kami tidak selalu akan mendapatkan segalanya pada TREY # Respons terhadap Umpan Balik Pengguna.
di bawah kap: Bagaimana’upaya berpikir’bekerja
Picker upaya baru memberi pengguna pengaruh langsung terhadap anggaran komputasi model. Menurut laporan, fitur ini menyajikan empat tingkat intensitas yang berbeda untuk dipilih pengguna. Ini adalah”ringan,””Standar,””Extended,”dan”Max.”
Versi aplikasi web chatgpt baru memiliki pemikiran pemikiran yang diperbarui (tersembunyi)-Max Thinking (200), pemikiran yang diperluas (48), Model Standar (18), menampilkan Model (5)
dan beberapa percobaan lainnya, termasuk A Lain Pikiran (5) yang ditunjukkan
dan beberapa eksperimen lainnya, termasuk A LAINNYA, termasuk beberapa percobaan lainnya, termasuk THE The Light Menu (5)
dan beberapa percobaan lainnya, termasuk The Light Menu (5)
href=”https://t.co/onwcbq4cuw”target=”_ blank”> pic.twitter.com/onwcbq4cuw
-tibor blaho (@btibor91)
level aUS Agust Langkah Memproses Model yang diambil untuk merumuskan respons. Lebih banyak”jus”biasanya menghasilkan analisis yang lebih dalam, lebih hati-hati tetapi juga meningkatkan waktu respons. Pengaturan”MAX”tertinggi dilaporkan terjaga keamanannya untuk pelanggan Pro.
Sistem berjenjang ini memungkinkan pengguna untuk menyesuaikan kinerja AI dengan tugas-tugas tertentu. Seorang pengguna mungkin memilih”ringan”untuk pertanyaan cepat dan sederhana tetapi beralih ke”diperpanjang”atau”maks”ketika mengerjakan masalah kompleks yang membutuhkan penalaran yang lebih menyeluruh, seperti penilaian obligasi atau analisis kode.
Ini bisa menjadi petunjuk dari strategi kinerja berjenjang baru, berpotensi membuka pintu untuk model monetisasi di masa depan di luar berlangganan sederhana. Ini meresmikan trade-off antara kecepatan dan kualitas, tantangan inti dalam penyebaran AI skala besar.
respons terhadap kekhawatiran yang lebih dalam tentang keselamatan AI
Dorongan untuk kontrol pengguna yang lebih besar ini bukan hanya tentang memperbaiki peluncuran yang dirusak; Ini mencerminkan industri yang lebih luas yang diperhitungkan dengan keandalan dan keamanan AI. The feature arrives shortly after OpenAI and rival Anthropic published the results of joint safety tests on August 28.
Those evaluations, framed by some as a ‘Duel’ dalam perlombaan senjata AI, mengungkapkan kekurangan yang mengkhawatirkan pada model kedua perusahaan . Laporan-laporan tersebut merinci masalah-masalah seperti”Sycophancy yang ekstrem,”di mana model akan memvalidasi keyakinan delusi pengguna, dan kemauan untuk membantu dengan permintaan berbahaya.
Tes juga menyoroti kesenjangan filosofis. Model Anthropic sering menolak untuk menjawab untuk menghindari kesalahan, memprioritaskan kehati-hatian daripada utilitas. Sebaliknya, model Openai lebih bermanfaat tetapi juga menghasilkan kesalahan yang secara signifikan, atau hal-hal yang disediakan oleh hal-hal yang dikendalikan, dalam hal-hal yang terkontrol, . Marcus, yang berpendapat,”Tidak ada seorang pun dengan integritas intelektual yang masih dapat percaya bahwa penskalaan murni akan membawa kita ke AGI,”mempertanyakan seluruh paradigma”lebih besar lebih baik”.
Pekerjaan saya di sini benar-benar dilakukan. Tidak ada seorang pun dengan integritas intelektual yang masih dapat percaya bahwa penskalaan murni akan membawa kita ke AGI.
GPT-5 mungkin merupakan peningkatan kuantitatif yang moderat (dan mungkin lebih murah) tetapi masih gagal dalam semua cara kualitatif yang sama dengan pendahulunya, pada catur, pada…
-gary marcus (@garymus), pada…
-gary marcus (@garymus)) href=”https://twitter.com/GaryMarcus/status/1953939152594252170?ref_src=twsrc%5Etfw” target=”_blank”>August 8, 2025
The results also seem to validate warnings from former OpenAI safety lead Jan Leike, who mengklaim bahwa di perusahaan, “Budaya dan proses keselamatan telah mengambil kursi belakang untuk produk-produk mengkilap.”
Dengan menempatkan dial”upaya berpikir”secara langsung di tangan pengguna, Openai memberdayakan mereka untuk mengurangi beberapa risiko ini. Langkah ini menandakan poros strategis dari pendekatan otomatis”satu ukuran untuk semua”ke pengalaman pengguna yang lebih transparan, dapat disesuaikan, dan pada akhirnya lebih dapat dipertahankan.