OpenAI telah memperluas penawaran pengembangnya dengan meluncurkan versi lengkap model o1 melalui API-nya. Model penalaran tingkat lanjut ini, yang unggul dalam tugas-tugas kompleks dan multi-langkah, memperkenalkan fitur-fitur baru yang menjanjikan untuk mengubah cara pengembang membangun aplikasi yang didukung AI.

Pembaruan ini merupakan bagian dari rangkaian pengumuman “12 Hari OpenAI”, di mana perusahaan merilis fitur dan pembaruan baru untuk produk utamanya.

Bersamaan dengan model o1, OpenAI juga memiliki juga mengumumkan penyempurnaan pada Realtime API untuk interaksi suara dan metode penyesuaian preferensi baru, sehingga memberikan fleksibilitas yang belum pernah ada sebelumnya kepada developer.

Model o1-2024-12-17 menggantikan versi pratinjau o1 yang diluncurkan awal tahun ini. Menurut OpenAI, model yang diperbarui menawarkan “lebih komprehensif dan tanggapan yang akurat, terutama untuk pertanyaan yang berkaitan dengan program dan bisnis, dan kecil kemungkinannya untuk menolak permintaan secara salah.”

Peningkatan ini, ditambah dengan pengurangan 60% dalam penggunaan token penalaran, menjadikan model o1 lebih cepat, lebih efisien, dan lebih serbaguna.

[konten tertanam]

Meningkatkan Penalaran melalui API dengan Model o1

Model o1 OpenAI dirancang untuk menangani tugas-tugas yang memerlukan konsistensi logis dan kedalaman analitis, mengungguli iterasi sebelumnya pada tolok ukur seperti SWE-Bench Terverifikasi dan TUJUAN.

OpenAI melaporkan bahwa akurasi tugas pemrograman meningkat dari 52,3% menjadi 76,6%, sementara performa pada soal matematika melonjak dari 42% menjadi hampir 80%.

CategoryEvalo1-2024-12-17o1-pratinjauUmumGPQA berlian75.773.3MMLU (lulus @1)91.890.8CodingSWE-bench Terverifikasi48.941.3LiveCodeBench76.652.3MathMATH (lulus @1)96.485.5AIME 2024 (lulus @1)79.242.0MGSM (lulus @1)89.390.8VisionMMMU (lulus @1)77.3—MathVista (lulus @1)71.0—FactualitySimpleQA42.642.4AgentsTAU-bench (retail)73.5—TAU-bench (maskapai penerbangan)54.2—

Sumber: OpenAI

Salah satu fitur menonjol adalah dukungan output terstruktur, yang memungkinkan pengembang menghasilkan respons dalam format yang telah ditentukan sebelumnya seperti JSON.

Hal ini memastikan integrasi yang mulus dengan sistem eksternal seperti API dan database, menjadikan model ini ideal untuk aplikasi dalam dukungan pelanggan, logistik, dan analisis data.

Model ini juga memperkenalkan kemampuan penalaran visual, memungkinkan analisis gambar untuk tugas-tugas seperti debugging atau penelitian ilmiah. Misalnya, pengembang kini dapat memasukkan data visual, seperti dokumen yang dipindai atau cetak biru, dan menerima respons yang peka terhadap konteks.

Selain itu, parameter “upaya penalaran”baru memungkinkan pengembang mengontrol berapa lama waktu yang digunakan model untuk setiap tugas, menyeimbangkan presisi dan efisiensi.

OpenAI menjelaskan dalam blognya, “Kami terus meluncurkannya keluarkan akses secara bertahap sambil berupaya memperluas akses ke tingkat penggunaan tambahan dan meningkatkan batas kecepatan.”

Meningkatkan Interaksi Suara dengan Realtime API

OpenAI juga membuat kemajuan signifikan pembaruan ke Realtime-nya API, yang mendukung interaksi suara secara real-time. Penambahan WebRTC, Web Real-Time Communication — sebuah protokol untuk komunikasi latensi rendah — memungkinkan pengembang membuat aplikasi suara yang lancar untuk tutor virtual, asisten, dan alat penerjemahan. OpenAI memungkinkan koneksi peer-to-peer (P2P) tanpa memerlukan plugin atau perangkat lunak tambahan.

OpenAI menyoroti keunggulan WebRTC, menyatakan, “Dalam skenario di mana Anda ingin terhubung ke model Realtime dari klien yang tidak aman melalui jaringan (seperti browser web), sebaiknya gunakan metode koneksi WebRTC. WebRTC lebih siap untuk menangani status koneksi variabel, dan menyediakan sejumlah API yang mudah digunakan untuk menangkap input audio pengguna dan memutar streaming audio jarak jauh dari model.“

Implementasi WebRTC menggunakan apa yang disebut token ephemeral, kunci API sementara yang dirancang khusus untuk mengautentikasi aplikasi sisi klien dengan aman saat terhubung ke OpenAI Realtime API melalui WebRTC. Tujuannya adalah untuk memastikan mekanisme autentikasi yang aman dan berumur pendek yang menghindari paparan kunci API standar yang sensitif secara langsung di lingkungan klien seperti browser web.

Gambar: OpenAI

Peningkatan ke Realtime API menyederhanakan proses pengembangan, mengurangi kode yang diperlukan untuk aplikasi suara sekaligus meningkatkan kualitas audio dan akurasi respons. Pengembang kini dapat membuat aplikasi yang mulai merumuskan respons saat pengguna masih berbicara, sehingga meningkatkan daya tanggap.

Penyesuaian harga membuat aplikasi suara lebih mudah diakses. Biaya token audio GPT-4o telah berkurang sebesar 60%, sementara token input yang disimpan dalam cache kini 87,5% lebih murah. OpenAI juga telah memperkenalkan GPT-4o mini, opsi hemat biaya bagi pengembang yang mencari alternatif terjangkau, dengan harga $10 per juta token masukan.

Menyempurnakan Perilaku AI dengan Penyempurnaan Preferensi

Penyempurnaan preferensi adalah metode penyesuaian baru yang memungkinkan pengembang menyempurnakan perilaku model berdasarkan perbandingan respons berpasangan. Tidak seperti penyesuaian tradisional, yang bergantung pada pasangan input-output yang tepat, penyesuaian preferensi mengajarkan model untuk membedakan antara respons yang disukai dan yang kurang diinginkan.

OpenAI menggambarkan metode ini sebagai metode yang sangat efektif untuk tugas subjektif, seperti seperti menyesuaikan nada dan gaya dalam penulisan kreatif atau memastikan kepatuhan terhadap persyaratan format tertentu. Menurut OpenAI, pengguna awal seperti perusahaan analisis keuangan, melaporkan bahwa penyesuaian preferensi meningkatkan akurasi respons sebesar 5% untuk kueri yang kompleks dan di luar distribusi.

“Kami mulai menguji Penyempurnaan Preferensi dengan mitra terpercaya yang telah melihat hasil yang menjanjikan sejauh ini. Misalnya, Rogo AI⁠(terbuka di jendela baru) sedang membangun asisten AI untuk analis keuangan yang memecah kueri kompleks menjadi subkueri.

Dengan menggunakan tolok ukur yang dibuat oleh para ahli, Rogo-Golden, mereka menemukan bahwa meskipun Supervised Fine-Tuning menghadapi tantangan dengan perluasan kueri di luar distribusi—seperti hilangnya metrik seperti ARR untuk kueri seperti “seberapa cepat perusahaan X berkembang”—Penyempurnaan Preferensi menyelesaikan masalah ini, meningkatkan kinerja dari 75% akurasi pada model dasar menjadi lebih dari 80%.”

Memperluas Opsi SDK untuk Pengembang

Untuk mendukung lingkungan pemrograman yang lebih luas, OpenAI juga telah memperkenalkan SDK resmi untuk Buka dan Java, di samping pustaka yang ada untuk Python, Node.js, dan.NET. SDK ini menyederhanakan integrasi, memungkinkan pengembang menerapkan model AI dalam sistem backend atau aplikasi perusahaan yang dapat diskalakan.

Go SDK dirancang untuk aplikasi sisi server yang ringan dan efisien, sedangkan Java SDK melayani solusi tingkat perusahaan, menawarkan pengetikan yang kuat dan dukungan yang kuat untuk skala besar proyek. Dokumentasi OpenAI memberikan panduan terperinci untuk memanfaatkan alat-alat baru ini.

Pengumuman Sebelumnya Selama “12 Hari OpenAI”

Pada tanggal 16 Desember, OpenAI membuat ChatGPT-nya fitur penelusuran web langsung tersedia untuk semua pengguna, memungkinkan siapa saja mengambil informasi terkini langsung dari web. 

14 Desember menghadirkan opsi penyesuaian baru ke ChatGPT, memungkinkan pengguna menyederhanakan tugas dan mengelola proyek secara efektif. Projects memungkinkan pengguna mengelompokkan chat, file, dan instruksi khusus ke dalam folder khusus, sehingga menciptakan ruang kerja terorganisir untuk mengelola tugas dan alur kerja.

Sebagai peningkatan besar pada mode suara lanjutan untuk ChatGPT, OpenAI aktif. 12 Desember menambahkan kemampuan vision, sehingga memungkinkan pengguna berbagi video langsung dan layar untuk analisis dan bantuan real-time.

Pada 11 Desember, OpenAI merilis sepenuhnya Canvas, ruang kerja pengeditan kolaboratif yang menawarkan alat canggih untuk teks dan penyempurnaan kode. Pertama kali diluncurkan dalam versi beta pada bulan Oktober 2024, Canvas menggantikan antarmuka standar ChatGPT dengan desain layar terpisah, memungkinkan pengguna mengerjakan teks atau kode sambil melakukan pertukaran percakapan dengan AI.

Penambahan Eksekusi Python adalah fitur menonjol dari Canvas, yang memungkinkan pengembang menulis, menguji, dan men-debug skrip langsung di dalam platform. OpenAI mendemonstrasikan kegunaannya selama siaran langsung dengan menggunakan Python untuk menghasilkan dan menyempurnakan visualisasi data. OpenAI mendeskripsikan fitur ini sebagai “mengurangi gesekan antara pembuatan ide dan implementasi”.

Pada tanggal 9 Desember, OpenAI secara resmi meluncurkan Sora, alat AI canggihnya untuk menghasilkan video dari perintah teks, yang menandakan era baru bagi AI kreatif. Terintegrasi dengan akun ChatGPT berbayar, Sora memungkinkan pengguna untuk menganimasikan gambar diam, memperluas video yang ada, dan menggabungkan adegan menjadi narasi yang kohesif.

Dirilis pada tanggal 7 Desember adalah Reinforcement Fine-Tuning sebagai kerangka kerja baru yang dirancang untuk memungkinkan penyesuaian model AI untuk aplikasi spesifik industri. Ini adalah pendekatan terbaru OpenAI untuk meningkatkan model AI dengan melatih mereka menggunakan kumpulan data dan sistem penilaian yang disediakan pengembang. p>

Pada tanggal 5 Desember, OpenAI meluncurkan ChatGPT Pro, tingkat langganan premium baru dengan harga $200 per bulan, ditujukan bagi para profesional dan perusahaan yang mencari kemampuan AI tingkat lanjut untuk alur kerja dengan permintaan tinggi.

Categories: IT Info