Openai telah secara resmi meluncurkan keluarga model GPT-4.1, memperkenalkan tiga versi baru-GPT-4.1, GPT-4.1 Mini, dan GPT-4.1 Nano-yang bertujuan untuk menyeimbangkan kinerja tingkat atas dengan biaya dan kecepatan yang fleksibel. Dibangun untuk mengungguli pendahulunya, seri GPT-4.1 meningkatkan kemampuan inti seperti pembuatan kode, pengikut instruksi, dan penalaran konteks panjang sambil memberikan latensi yang lebih rendah dan penggunaan pahat yang lebih konsisten.

Tidak seperti GPT-4 dan GPT-4O, yang Power ChatGPT untuk pengguna Pro, model baru tersedia secara eksklusif melalui OpenAI API-memelihara fokus terus-menerus perusahaan pada integrasi perusahaan dan pengembang daripada pemutakhiran yang menghadap konsumen. Dengan mensegmentasi model baru menjadi tiga tingkatan kinerja yang berbeda, OpenAI memberi pengguna API kemampuan untuk skala berdasarkan ukuran dan anggaran beban kerja. Di bagian atas, model GPT-4.1 standar dirancang untuk aplikasi yang paling kompleks dan dihargai sesuai: $ 2 per juta token input dan token output $ 8 per juta.

GPT-4.1 Mini adalah opsi jalan tengah, menawarkan paritas dekat dalam tolok ukur intelijen dengan latensi yang jauh lebih rendah-dengan harga $ 0,40 per juta token input dan output $ 1,60 per juta. Untuk tugas-tugas ringan dan kasus penggunaan waktu nyata, GPT-4.1 Nano adalah yang paling hemat biaya, biaya hanya $ 0,10 per juta token input dan $ 0,40 per juta token output.

Setiap model dilengkapi dengan pertukaran kinerja, tetapi OpenAi mengklaim bahwa bahkan Model terkecil, Nano, Outperforms seperti GRETS LIUSTINGS SEBUAH GOPTAI-MIDEAIK BAHKAN DI BAGI MODEL terkecil, Nano, Outperforms Likforms Like GT. Penambahan ini mencerminkan penekanan Openai yang semakin besar pada membuat AI generatif dapat diakses di berbagai kasus penggunaan yang lebih luas-dari alur kerja agen berkinerja tinggi hingga alat tertanam di aplikasi konsumen.

Khususnya, ketiga model berbagi batas pengetahuan yang sama (Juni 2024) dan telah disetel untuk memberikan output yang lebih deterministik dan mengikuti format daripada generasi sebelumnya-membantu mengurangi halusinasi dan meningkatkan keandalan integrasi di lingkungan produksi. Tidak hanya untuk meneliti dan membuat prototipe, tetapi juga penyebaran skala tinggi dalam perangkat lunak komersial, platform SaaS, dan sistem agen otonom. Dengan GPT-4.1 yang sekarang diposisikan sebagai penerus pratinjau GPT-4.5 yang akan segera ditiup (berakhir 14 Juli 2025), OpenAI memperjelas bahwa generasi ini diharapkan membawa bobot operasional dari banyak mitra komersialnya. Kemajuan penting atas pendahulunya. Model GPT-4.1 standar mencapai skor 54,6% pada Benchmark terverifikasi swe-bench , menandai peningkatan absolut di atas GPT-4.6% GPT-26.6%.

Dalam instruksi berikut, GPT-4.1 mencetak 38,3% pada skala multichallenge Benchmark , yang mencerminkan peningkatan absolut 10,5% dari GPT-4o.

Additionally, GPT-4.1 set a new state-of-the-art result on the Video-MME benchmark for multimodal long-context understanding, scoring 72.0% on the “long, no subtitles”category, a 6.7% absolute improvement over GPT-4O.

Openai juga telah memperkenalkan dua versi ramping: GPT-4.1 Mini dan GPT-4.1 Nano. GPT-4.1 Mini menawarkan pengurangan latensi dan biaya, mencapai hampir setengah latensi dan pengurangan biaya 83% dibandingkan dengan GPT-4O, sementara mencocokkan atau melampaui kinerja GPT-4O dalam evaluasi intelijen.

GPT-4.1 Nano, model terkecil dan tercepat openai hingga saat ini, dioptimalkan untuk tugas yang membutuhkan latensi rendah dan efisiensi biaya. Ini mendukung jendela konteks hingga 1 juta token dan skor 80,1% pada MMLU, 50,3% pada GPQA, dan 9,8% pada tolok ukur pengkodean polyglot, melampaui kinerja GPT-4O yang melampaui API. Harga untuk model adalah sebagai berikut: GPT-4.1 pada $ 2 per juta token input dan $ 8 per juta token output; GPT-4.1 Mini pada $ 0,40 per juta token input dan $ 1,60 per juta token output; dan GPT-4.1 Nano pada token input $ 0,10 per juta dan token output $ 0,40 per juta. 

instruksi yang ditingkatkan berikut dan pemahaman konteks panjang

Openai telah berfokus pada peningkatan kemampuan model untuk mengikuti instruksi dan memahami input konteks panjang. Model GPT-4.1 dirancang untuk lebih memanfaatkan jendela konteks yang luas, mendukung hingga 1 juta token, dan menunjukkan peningkatan pemahaman konteks panjang. Peningkatan ini membuat model lebih efektif untuk memperkuat agen AI yang mampu menyelesaikan tugas secara mandiri atas nama pengguna, seperti rekayasa perangkat lunak, analisis dokumen, dan dukungan pelanggan.

Menurut OpenAi, “Perbaikan Instruksi yang Mengikuti Pengguna dan Konteks Panjang juga membuat GPT-4.1 Model yang lebih efektif pada agen yang lebih efektif, atau Penggunaan Penggunaan, atau PERSIS yang dapat dilakukan oleh CANKEDE, atau PERSIS PERSOSE, ATAU PERNAH-NEGEN KEPALA, ATAU PERNAH yang lebih efektif, atau PERSIS PERSOSE, ATAU PERSOSE, ATAU PERSOSE PERSODE, ATAU PERSODE PERNAH MENGUBAH, ATAU PERSODE PERSOSE, ATAU PERSODE PERSODE, ATAU KONTEKS DAN KONTEKS LAMA YANG TEPACI DARI GPT-4.1

Keterbatasan dan Pertimbangan Model

Sementara model GPT-4.1 menawarkan kemajuan yang bermakna, OpenAI mengakui keterbatasan tertentu. Model dapat lebih literal daripada versi sebelumnya, kadang-kadang membutuhkan petunjuk yang lebih spesifik dan eksplisit dari pengguna. Selain itu, keakuratan model berkurang seiring dengan meningkatnya jumlah token input; Dalam tes Openai sendiri, akurasi turun dari sekitar 84% dengan 8.000 token hingga 50% dengan 1.024 token.

Openai juga mencatat bahwa GPT-4.1 menjadi kurang dapat diandalkan, semakin banyak token input yang harus diproses, menyoroti pentingnya rekayasa yang cepat dan manajemen konteks dalam pengembangan aplikasi. Dalam posting resminya, perusahaan menyatakan, “Penguji awal mencatat bahwa GPT-4.1 dapat lebih literal, jadi kami sarankan menjadi eksplisit dan spesifik dalam permintaan.”

Selain itu, model pratinjau GPT-4.5 akan ditinggalkan pada 14 Juli 2025, dengan cara adopsi GPT-4.1 Juli. Model yang lebih baru memiliki cutoff pengetahuan Juni 2024, memberikan pengembang akses ke lebih banyak data saat ini dibandingkan dengan versi sebelumnya.

Categories: IT Info