OpenAI telah membalikkan keputusan Februari untuk membatalkan model O3, mengumumkan sebaliknya ia akan melancarkan O3 dan O4-Mini pada minggu-minggu akan datang GPT-5 ditahan sehingga akhir tahun ini. Kemas kini telah disahkan oleh Ketua Pegawai Eksekutif Sam Altman dalam jawatan di X, di mana beliau berkata syarikat itu kini akan terus memisahkan model yang memisahkan diri dari model bahasa umumnya. model dan model sembang/penyempurnaan.”Altman menulis. Beliau menambah,”Kami teruja dengan prestasi yang kami lihat dari O3 secara dalaman.”src=”https://winbuzzer.com/wp-content/uploads/2023/08/openai-logo.jpg”> href=”https://twitter.com/sama/status/1908167621624856998?ref_src=twsrc%5etfw”sasaran=”_ blank”> 4 April 2025 Keupayaan terus ke GPT-5. Strategi itu bertujuan untuk mengurangkan kekeliruan pengguna dan menyelaraskan kerumitan produk. Openai mengatakan ia mahu mewujudkan satu sistem yang boleh berfungsi dengan semua fungsi tanpa memerlukan”pemetik model.”Tetapan kecekapan rendah dan 91.5% dalam mod kecekapan tinggi. Pada penanda aras matematik AIME 2024, ia mencapai 96.7%. Ia juga berfungsi dengan baik pada GPQA Diamond, ujian untuk penalaran sains peringkat PhD, dengan skor 87.7%. Nombor-nombor ini meletakkan O3 di atas GPT-4.5 dan O3-mini dalam tugas-tugas teknikal tertentu, terutamanya dalam domain berstruktur. Ini membolehkan ia menangani masalah pelbagai langkah kompleks yang lebih berkesan daripada model terdahulu.

Satu lagi ciri utama ialah keupayaannya untuk mengira skala berdasarkan kerumitan tugas. O3 membolehkan pemaju meningkatkan kedalaman penalaran, tetapi tradeoff adalah penggunaan curam yang curam-sehingga 172x lebih banyak dalam konfigurasi kecekapan tinggi. Permintaan ini disahkan dalam blog arka arka dan menimbulkan persoalan mengenai kemungkinan pada skala.

O4-Mini, walaupun belum dirilis, dijangka menjadi adik yang lebih kecil kepada O3. Berdasarkan konvensyen penamaan Openai, ia mungkin menawarkan keperluan pengiraan yang dikurangkan dengan banyak manfaat penalaran yang sama. Syarikat itu belum berkongsi penanda aras atau spesifikasi awam. Pada 20 Mac, syarikat itu melancarkan O1-Pro melalui akses API, mensasarkan kes penggunaan perusahaan seperti saluran paip teknologi dan ejen. Model ini menyokong sehingga 100,000 token output dan memerlukan $ 5 dalam perbelanjaan sebelumnya untuk membuka kunci akses. Harga bermula pada $ 150 per juta token input dan $ 600 untuk output.

Diterangkan oleh OpenAI sebagai model yang menggunakan lebih banyak pengiraan untuk berfikir lebih keras dan memberikan jawapan yang lebih baik secara konsisten, ia diperkenalkan melalui Oping Oping Opy API, Copilot tanpa sebarang kos, seperti yang dilaporkan pada 7 Mac. Ini menunjukkan perbezaan dalam model perniagaan: Microsoft mengikat alat penalaran terbuka ke dalam perisian yang lebih luas, sementara OpenAI mengewangkan penalaran sebagai ciri premium. Altman berkata model itu akan tiba”dalam beberapa bulan,”walaupun tiada tarikh tertentu telah diberikan. Apabila ia dilancarkan, GPT-5 dijangka mengintegrasikan penalaran dan generasi dalam satu sistem. Matlamat itu pada asalnya telah disebutkan dalam pelan Februari yang telah ditinggalkan sekarang untuk melipat O3 ke GPT-5. Dikeluarkan pada akhir Februari, GPT-4.5 memperluaskan tetingkap konteks sistem kepada 200,000 token dan memperkenalkan peningkatan dalam pemahaman berbilang bahasa. Walau bagaimanapun, ia masih kurang baik dalam penanda aras matematik dan sains berbanding dengan O3-Mini. Openai mengakui bahawa model seperti O3-mini masih melepasi GPT-4.5 dalam domain yang tinggi seperti pengekodan dan penyelesaian masalah lanjutan.

Peralihan pelan tindakan terbaru OpenAI sedang berlaku bersama-sama dengan pergerakan kewangan dan infrastruktur yang besar. Pada 1 April, syarikat itu mengumumkan perjanjian tender $ 40 bilion yang diketuai oleh SoftBank, menolak penilaiannya kepada $ 300 bilion. Struktur perjanjian itu-sebelum ini jualan saham sekunder yang dibenarkan pekerja awal dan pelabur untuk mengeluarkan tekanan sambil meningkatkan tekanan ke OpenAI untuk menghantar produk bernilai tinggi.

Pada bulan Mac, ia menandatangani perjanjian pengiraan $ 11.9 bilion dengan CoreWeave dan mengambil kepentingan ekuiti $ 350 juta dalam syarikat itu. Ia juga meneruskan pembangunan cip AI adat dalam kerjasama dengan Broadcom dan TSMC, dengan reka bentuk awal yang dijangkakan pada tahun ini.

Model terbuka dan ketelusan Push

Sebelum pembalikan O3, Altman juga mengumumkan bahawa OpenAI sedang menyediakan pembebasan model bahasa terbuka yang pertama sejak GPT-2. Beliau menyifatkan model itu sebagai”cukup berkebolehan”dan meminta pemaju dan penyelidik memberi maklum balas tentang cara meningkatkan utilitinya. Syarikat itu menjelaskan bahawa model itu akan merangkumi berat pra-terlatih tetapi bukan data latihan atau kod.

“[W] e teruja untuk menjadikan ini model yang sangat baik!”Altman menulis. Langkah ini datang di tengah-tengah permintaan pemaju yang semakin meningkat untuk ketelusan dan sebagai tindak balas kepada persaingan dari model sumber terbuka yang dikeluarkan oleh Meta, Mistral, dan Deepseek.

OpenAI juga telah membuat perubahan untuk meningkatkan tafsiran. Pada bulan Februari, syarikat itu mula mendedahkan jejak penalaran dalaman dari O3-Mini, membantu pemaju dan penyelidik memahami bagaimana model tiba di jawapan. Keputusan ini mencerminkan peralihan yang lebih luas ke arah penjelasan di seluruh keluarga model penalaran syarikat.

Masa depan modular untuk pelan semula model OpenAI

Daripada menunggu untuk membungkus keupayaan ke dalam satu model sempadan yang merangkumi semua, OpenAI kini melepaskan alat khusus kerana mereka menjadi siap pengeluaran.

Peralihan itu datang dengan perdagangan. Pengguna kini menghadapi lebih banyak jenis model, tetapi masing-masing lebih baik dioptimumkan untuk tugas-tugas tertentu. Perusahaan boleh mengadopsi model penalaran mewah seperti O1-Pro, sementara pemaju mendapat akses kepada sistem perantaraan seperti O4-Mini-atau untuk versi terbuka untuk percubaan yang lebih telus. Sama ada GPT-5 akhirnya akan menyatukan penawaran ini-atau hanya satu lagi cawangan dalam model pokok yang berkembang-kekal untuk dilihat.

Categories: IT Info