OpenAI telah mengemas kini model GPT-4Onya, meningkatkan keupayaannya untuk mengendalikan pertanyaan yang berkaitan dengan STEM, mentafsirkan data visual, dan memasukkan pengetahuan yang lebih baru ke dalam responsnya.
Kemas kini terkini memperluaskan data latihan model dari November 2023 hingga Jun 2024, yang membolehkannya memproses pelbagai topik semasa dengan ketepatan yang lebih besar. Di samping kemajuan teknikal ini, OpenAI telah menyesuaikan gaya perbualan model dengan meningkatkan penggunaan emojis dalam interaksi kasual. Risiko dalam pembangunan AI pesat
openai mengatakan bahawa gpt-4O kini menunjukkan prestasi yang lebih kukuh pada penanda aras AI multimodal seperti Mathvista dan MMMU, yang menguji keupayaan model untuk memahami dan menganalisis kedua-dua teks dan imej. Menurut OpenAI, model yang ditapis memberikan”pandangan yang lebih kaya dan panduan yang lebih tepat”ketika menilai kandungan visual, menjadikannya lebih berkesan untuk pengguna yang bekerja dengan rajah kompleks, skema teknikal, dan visualisasi data.
Penambahbaikan juga meningkatkan kebolehpercayaan GPT-4O dalam bidang STEM, kawasan di mana model AI mempunyai cabaran yang dihadapi secara historis, terutamanya dengan penyelesaian masalah yang kompleks. Penalaran konseptual dan penguasaan teknikal yang lebih baik. Untuk hasil web. dan pengekodan. Kemas kini meningkatkan keupayaan model untuk memproses logik berstruktur dan pengiraan berangka, kawasan di mana lelaran sebelumnya kadang-kadang menghasilkan hasil yang salah.
OpenAI menekankan penambahbaikan ini dalam pengumumannya, menyatakan,”GPT-4O kini lebih baik pada masalah matematik, sains, dan pengekodan, dengan keuntungan pada eval akademik seperti GPQA dan matematik. Skor yang lebih baik pada MMLU-penanda aras komprehensif pemahaman bahasa, keluasan pengetahuan, dan penalaran-mencerminkan keupayaannya untuk menangani masalah yang lebih kompleks di seluruh domain.”Penyelesaian masalah AI, terutamanya di kawasan yang memerlukan ketepatan seperti kalkulus lanjutan, algoritma pembelajaran mesin, dan simulasi saintifik. adalah pusat kepada bidang seperti pembangunan perisian dan fizik teoritis.
/P>
Walaupun OpenAI tidak menyatakan secara jelas sama ada GPT-4O menggabungkan kemajuan baru dalam penalaran berstruktur, prestasi model yang lebih baik pada GPQA dan MMLU mencadangkan penambahbaikan bagaimana ia memproses tugas logik pelbagai langkah.
Analisis imej yang lebih tepat dan pemahaman multimodal
Kemas kini juga meningkatkan keupayaan GPT-4O untuk memproses imej, menjadikannya alat yang lebih berkemampuan untuk menganalisis hubungan spatial, mentafsirkan gambarajah teknikal, dan menyediakan Wawasan yang menyedari konteks berdasarkan input visual.
OpenAI melaporkan bahawa GPT-4O kini berada di kedudukan yang lebih tinggi pada penanda aras penilaian multimodal seperti Mathvista dan MMMU, yang menunjukkan prestasi yang lebih kukuh dalam mengintegrasikan penalaran berasaskan teks dan visual. menyatakan bahawa”model yang dikemas kini lebih mahir menafsirkan hubungan spatial dalam muat naik imej, serta menganalisis rajah kompleks, pemahaman carta dan graf, dan menghubungkan input visual dengan kandungan bertulis.”
Menganalisis data visual dengan lebih berkesan menjadikan GPT-4O berguna untuk aplikasi dalam bidang kejuruteraan, seni bina, dan sains data, di mana model AI mesti memproses dan mentafsirkan gambar rajah atau skema dengan ketepatan yang tinggi.
Bagi pengguna yang bekerja dengan lukisan teknikal terperinci, Blueprints, atau plot matematik, penambahbaikan ini bermakna ChatGPT kini boleh menawarkan pandangan yang lebih terperinci ke dalam susun atur ruang dan hubungan berangka dalam data visual. imej, seperti penyelidikan saintifik, pemetaan geospatial, dan pengimejan perubatan. Gaya perbualan GPT-4O, menggabungkan lebih banyak penggunaan emoji ke dalam respons. Syarikat itu menyatakan bahawa model itu kini secara dinamik termasuk emojis dalam interaksi, terutamanya apabila pengguna sudah menggunakannya dalam mesej mereka.
OpenAI mengakui pelarasan dalam pengumumannya, menjelaskan,”GPT-4O kini sedikit lebih bersemangat dalam penggunaan emojinya (mungkin terutamanya jika anda menggunakan emoji dalam perbualan ✨)-beritahu kami apa yang anda tahu apa yang anda tahu apa yang anda tahu apa yang anda tahu apa yang anda tahu Fikirkan.”
Syarikat telah menggalakkan pengguna untuk memberi maklum balas sama ada peningkatan penggunaan emojis meningkatkan pengalaman pengguna atau harus diselaraskan dalam kemas kini masa depan.
Walaupun perubahan berkaitan emoji tidak memberi kesan kepada keupayaan penalaran model, ia menandakan trend yang lebih luas ke arah membuat interaksi AI lebih semula jadi dan manusia. Pilihan penyesuaian untuk nada perbualan dalam lelaran masa depan. Suatu ketika OpenAI menghadapi persaingan yang semakin meningkat dari pemaju AI saingan, terutamanya dalam bidang kecekapan dan prestasi pemikiran.
DeepSeek, sebuah syarikat AI yang berpangkalan di China, baru-baru ini memperkenalkan model R1nya, yang telah menunjukkan hasil yang kuat dalam penanda aras penalaran semasa beroperasi pada sebahagian kecil daripada sumber pengiraan yang digunakan oleh model Openai. Pendekatan yang didorong oleh kecekapan DeepSeek telah mendorong respons dari pemimpin industri, termasuk Ketua Pegawai Eksekutif Terbuka Sam Altman, yang mengakui persaingan dengan menyatakan,”Kami jelas akan memberikan model yang lebih baik dan juga menarik beberapa siaran.”P>
Berkaitan: AI Audit-DeepSeek gagal 83% ujian ketepatan kerana maklumat salah dan penapisan
Bersedia untuk melancarkan O3-Mini, model yang berfokus pada alasan yang dioptimumkan untuk kelajuan dan kecekapan
Di luar pengguna yang menghadap AI, OpenAI memperluaskan jangkauannya ke sektor awam dengan ChatGPT Gov, versi modelnya yang direka untuk digunakan oleh agensi persekutuan A.S.. 5 (IL5) Piawaian keselamatan, memastikan pematuhan peraturan persekutuan. Model ini sedang menjalani proses akreditasi FedRamp, keperluan utama penyedia awan yang bekerja dengan agensi kerajaan A.S.. Gov dalam aliran kerja sektor awam, menyatakan,”Kami melihat potensi besar untuk alat-alat ini untuk menyokong sektor awam dalam menangani cabaran yang kompleks.”
Openai melaporkan bahawa lebih daripada 90,000 pekerja kerajaan telah menggunakan alat AInya, dengan Program perintis awal menunjukkan keuntungan produktiviti yang boleh diukur. > Dengan gelombang seterusnya kemajuan AI di cakrawala, OpenAI mungkin memberi tumpuan kepada skala modelnya sambil memastikan kebolehpercayaan dalam aplikasi dunia nyata. pasaran dengan strategi pengoptimuman yang berbeza.