OpenAI Today melancarkan Ejen ChatGPT, pembantu AI yang paling berkuasa sehingga kini, bertujuan untuk membuat alat yang secara aktif melengkapkan kerja untuk pengguna daripada hanya menjawab soalan. Ejen baru mengendalikan”komputer maya”untuk melaksanakan tugas-tugas pelbagai langkah yang kompleks. Pelancaran ini meningkatkan perlumbaan untuk supremasi dalam agentik AI, membuka terbuka terhadap inisiatif dari Google, Anthropic, dan Microsoft. Ia menggantikan alat pengendali syarikat, yang pertama kali diperkenalkan pada Januari 2025 sebagai ejen yang lebih terhad, berasaskan pelayar. Pembidaan

chatgpt ejen mewakili percubaan OpenAI yang paling berani untuk membuat produk yang benar-benar agentik. Ia adalah dikuasakan oleh model baru yang tidak dinamakan dari keluarga Openai O3 . Sistem ini direka untuk mengimbangi tugas-tugas kompleks dari pengguna, seperti peristiwa perancangan dengan memeriksa kalendar atau menghasilkan dek slaid.

Untuk membina alat baru, OpenAI menggabungkan pasukan di belakang kedua-dua pengendali dan penyelidikan yang mendalam, mewujudkan kumpulan bersatu yang memberi tumpuan kepada arah yang baru ini. Penyusunan semula dalaman ini menggariskan kepentingan strategik bergerak melampaui chatbots mudah.

Tidak seperti pendahulunya, Agen CHATGPT dilengkapi dengan set alat yang lebih komprehensif. Ia menggabungkan penyemak imbas visual jauh dengan terminal untuk melaksanakan kod, melakukan analisis data, dan juga membuat spreadsheet.

[Kandungan tertanam]

yash Kumar, plumbum produk terbuka untuk ejen, menjelaskan bahawa”kerana chatgpt mempunyai akses kepada’bobal’. Untuk mengakses sumber dan aplikasi data luaran seperti Google Drive, langkah penting dari penawaran sebelumnya.

Model yang mendasari menawarkan prestasi terkini pada tanda aras yang sukar. Pada fronermath, ujian matematik yang mencabar, ejen menjaringkan 27.4% apabila menggunakan alatnya, lompatan besar-besaran dari 6.3% yang dicapai oleh model atas sebelumnya, O4-Mini. Pemimpin penyelidikan Isa Fulford menyatakan bahawa pengguna tidak dimaksudkan untuk menontonnya berfungsi, membingkainya sebagai pembantu latar belakang.”Walaupun ia mengambil masa 15 minit, setengah jam, ia agak besar berbanding dengan berapa lama ia akan membawa anda untuk melakukannya,”katanya, menekankan peranannya dalam mengendalikan proses yang memakan masa. href=”https://cdn.openai.com/pdf/18a02b5d-6b67-4cec-ab64-68cdfbddebcd/preparedness-framework-v2.pdf”target=”_ blank. Ini adalah langkah berjaga-jaga terhadap potensi penyalahgunaan, terutamanya dalam domain biologi dan kimia, walaupun tanpa bukti langsung risiko.

Kawalan pengguna adalah tema utama. Fulford mengesahkan bahawa”Sebelum ejen chatgpt melakukan apa-apa’tidak dapat dipulihkan,’seperti menghantar e-mel atau membuat tempahan, ia meminta izin terlebih dahulu.”Langkah Pengesahan Pengguna ini adalah penting untuk tindakan dengan akibat dunia nyata, membina reka bentuk keselamatan pertama ejen pengendali terdahulu.

Lapisan keselamatan selanjutnya termasuk”mod menonton.”Ciri ini secara automatik menjeda pelaksanaan ejen di laman web sensitif, seperti portal kewangan, jika pengguna menavigasi dari tab. Di samping itu, OpenAI telah melumpuhkan ciri memori ChATGPT pada pelancaran untuk mengurangkan risiko pengelupasan data dari serangan suntikan yang cepat. Ia adalah tindak balas langsung kepada alat yang sama dari pesaing. Anthropic adalah awal dengan ciri”penggunaan komputer”untuk model Claude, yang dikeluarkan pada bulan Oktober 2024.

Google juga banyak dilaburkan, dengan pelaut projeknya dan ujian fungsi”penggunaan komputer”di studio AI. Microsoft juga membenamkan ciri-ciri seperti ejen ke studio Copilotnya. Charles Lamanna, VP Microsoft, dengan ringkas menangkap gol:”Jika seseorang boleh menggunakan aplikasinya, ejen itu juga boleh.”Sejarah ini menetapkan bar yang tinggi untuk ejen yang baru dan lebih berkemampuan.

Dorongan kompetitif ini datang walaupun soalan mengenai keberkesanan ejen. Kajian Carnegie Mellon baru-baru ini mendapati bahawa model AI yang terkini berjuang dengan tugas automasi perniagaan, menonjolkan isu-isu dengan akal sehat dan pelayaran web. Ejen baru Openai akan diukur terhadap penanda aras prestasi dunia ini.

Categories: IT Info