OpenAI telah melancarkan O3-Pro, model penalaran utama baru yang bertujuan untuk profesional dan perusahaan yang menuntut tahap ketepatan yang lebih tinggi untuk penyelesaian masalah yang kompleks. Pelepasan ini mewujudkan peringkat premium baru untuk AI yang paling maju syarikat, yang dilengkapi dengan harga harga sepuluh kali lebih tinggi daripada rakan sejawat O3 yang standard. Kepada Pengumuman rasmi dari Pusat Bantuan Openai. Walaupun Openai mengadakan prestasi unggul pada penanda aras akademik ke atas pesaing, nilai sebenar O3-Pro nampaknya terletak di luar ujian mudah. Ulasan Akses Awal mencadangkan kecerdasan lanjutannya hanya dibuka sepenuhnya apabila makan konteks yang luas, meletakkannya kurang sebagai chatbot perbualan dan banyak lagi sebagai enjin khusus untuk analisis yang mendalam.

Model O3-Pro kini tersedia untuk pelanggan ChatGPT Pro dan pasukan, menggantikan O1-Pro yang lebih tua, dengan akses untuk pelanggan Enterprise dan EDU dijangka mengikutinya. Walau bagaimanapun, prestasi premium datang dengan perdagangan; OpenAI mengesahkan bahawa respons dari O3-Pro biasanya lebih perlahan daripada pendahulunya dan bahawa, pada pelancaran, model tidak mempunyai sokongan untuk penjanaan imej, sembang sementara, dan ciri kanvas.

Ini menjadikannya pelaburan yang signifikan berbanding dengan standard O3 yang baru diskaun, yang kini berharga hanya $ 2 dan $ 8 untuk jumlah token yang sama. Strategi harga seolah-olah bertujuan untuk penetapan semula pasaran, kerana O3-Pro juga dilaporkan 87% lebih murah daripada model O1-Pro yang digantikannya, menunjukkan langkah untuk membuat keupayaan tertinggi di peringkat lebih tinggi, namun masih berbeza. Syarikat menyatakan bahawa model baru dinilai lebih tinggi untuk kejelasan, ketepatan, dan keupayaan untuk mengikuti arahan yang kompleks. Tidak percaya kadar kemenangan relatif kepada O3 kali pertama saya melihatnya”. Keyakinan ini disokong oleh ujian dalaman yang menunjukkan O3-Pro mengatasi Gemini 2.5 Pro Google dan Anthropic’s Claude 4 opus pada penanda aras sains dan matematik yang sukar. Menurut Kajian awal-mendalam di ruang laten , keupayaan dipertingkatkan model tidak selalu jelas dalam satu pertanyaan yang mudah. Kunci untuk memanfaatkan kuasanya adalah untuk menyediakannya dengan sejumlah besar maklumat yang relevan. Pendekatan terbaik, semakan mencadangkan, adalah untuk merawatnya seperti”penjana laporan”dan bukannya chatbot.

Dalam satu ujian oleh ruang laten model diberi dokumen dan matlamat syarikat dalaman. Analisis yang dihasilkan sangat spesifik dan berakar pada data yang disediakan yang mereka katakan”sebenarnya mengubah bagaimana kita memikirkan masa depan kita.”Walau bagaimanapun, pengalaman positif yang positif ini tidak universal. Output”malas”dan sukar untuk membezakan dari O3 biasa. Selanjutnya menguatkan sudut”alat khusus”, pemaju dan blogger simon willison nota Src=”Data: Image/Svg+Xml; Nitro-empty-id=mty0ndoxnji4-1; base64, phn2zyb2awv3qm94psiwidagmti4mca3mjai Ihdpzhropssixmjgwiibozwlnahq9ijcymcigeg1sbnm9imh0dha6ly93d3cudzmub3jnlziwmdavc3znij48l3n2zz4=”>

Dari ejen ke penganalisis: Peralihan strategik O-Series

Pelancaran O3-Pro menandakan langkah penting dalam evolusi model”O-Series”Openai. Model-model ini pada asasnya berbeza dari garis GPT, yang direka untuk”kedalaman”dan”perbincangan”dengan anggaran yang lebih besar untuk pemikiran dalaman dan penggunaan alat asli. Senibina ini membolehkan mereka merancang dan bertindak dalam proses penalaran mereka sendiri, keupayaan yang pertama dipamerkan dengan pelepasan April O3 dan O4-Mini. Ini mewakili peralihan strategik dari pembantu AI yang hanya menjawab soalan kepada”rakan kongsi strategik”yang dapat secara aktif membantu pengguna mencapai matlamat. Pengenalan versi”pro”kurang dari dua bulan kemudian menunjukkan bahawa Openai kini memberi tumpuan kepada pengerasan kemahiran agenik eksperimen ini ke dalam alat yang boleh dipercayai, enterprise.

Tidak lama selepas debut model O3, laporan munculnya mempunyai kecenderungan yang lebih tinggi untuk halusinasi daripada model yang lebih tua. Firma AI Vectara mendapati bahawa model O3 mempunyai kadar halusinasi 6.8% apabila meringkaskan artikel. Penyelidikan bebas dari menerbitkan AI Contoh-contoh terperinci di mana versi pra-pelepasan O3 akan membuat tindakan yang diperlukan untuk menyelesaikan masalah. Perintah penutupan dalam persekitaran terkawal. Penemuan kumpulan itu termasuk tuntutan yang menarik bahawa ini adalah”model AI kali pertama telah diperhatikan menghalang diri mereka daripada ditutup walaupun arahan yang jelas sebaliknya.”Dalam satu langkah yang jelas ke arah ketelusan yang lebih besar, Openai melancarkan’Hub Penilaian Keselamatan’awam pada bulan Mei untuk berkongsi keputusan ujian dalaman, pembangunan