OpenaiはGPT-4.1モデルファミリーを正式に発売し、GPT-4.1、GPT-4.1 Mini、およびGPT-4.1 Nanoの3つの新しいバージョンを導入しました。 GPT-4.1シリーズは、前任者よりも優れているために構築され、コード生成、命令のフォロー、長いコンテキストの推論などのコア機能を改善しながら、より低いレイテンシとより一貫したツールの使用を提供します。
Proユーザー向けのパワーチャットGPTとは異なり、新しいモデルはOpenai APIを通じてのみ利用可能です。これは、消費者向けチャットボットの使用ではなく、企業と開発者の統合に継続的に焦点を当てています。新しいモデルを3つの異なるパフォーマンス層に分割することにより、OpenaiはAPIユーザーにワークロードのサイズと予算に基づいて拡張する機能を提供しています。最上部では、標準のGPT-4.1モデルは最も複雑なアプリケーション向けに設計されており、それに応じて価格設定されています:100万ドルあたりの入力トークン2ドル、100万ドルあたりの出力トークン8ドル。
gpt-4.1 miniは中間地面のオプションであり、はるかに低いレイテンシを持つインテリジェンスベンチマークのほぼパリティを提供します。軽量のタスクとリアルタイムのユースケースの場合、GPT-4.1ナノは最も費用効率が高く、100万個の入力トークンあたり0.10ドル、100万個の出力トークンあたり0.40ドルです。これらの追加は、高性能エージェントワークフローから消費者アプリに組み込みツールまで、より広範なユースケースで生成AIをアクセスできるようにすることに対するOpenAIの強調を反映しています。
特に、3つのモデルはすべて、同じ知識カットオフ(2024年6月)を共有し、以前の世代よりも決定的で形式の形式の出力を提供するように調整されています。それは、研究とプロトタイピングだけでなく、商用ソフトウェア、SAASプラットフォーム、自律エージェントシステムでの高級展開に魅力的です。 GPT-4.1が近日中に減少するGPT-4.5プレビュー(2025年7月14日終了)の後継者として位置付けられているため、Openaiは、この世代が今後多くの商業パートナーの運用上の重みを運ぶことが期待されていることを明らかにしています。前任者に対する顕著な進歩。標準のGPT-4.1モデルは、 swe-bench verified benchmark で54.6%のスコアを達成しました。
次の命令では、GPT-4.1は scaleのマルチチャレンジベンチマークで38.3%を獲得しました。
さらに、GPT-4.1は video-mmeベンチマークで新しい最先端の結果を設定します。 GPT-4O。
Openaiは、GPT-4.1 MINIとGPT-4.1 NANOの2つの合理化されたバージョンも導入しました。 GPT-4.1 MINIは、レイテンシとコストの削減を提供し、GPT-4Oと比較してレイテンシの半分近くと83%のコスト削減を達成し、GPT-4Oのインテリジェンス評価のパフォーマンスを一致または超えています。
GPT-4.1 Nano、Openaiのこれまでで最速で最速のモデルは、低遅延と費用効率を必要とするタスクに最適化されています。これは、最大100万トークンのコンテキストウィンドウをサポートし、MMLUで80.1%、GPQAで50.3%、Aiderポリグロットコーディングベンチマークで9.8%をサポートし、GPT-4o Miniのパフォーマンスを上回ります。モデルの価格は次のとおりです。GPT-4.1は、100万ドルあたり2ドル、100万ドルの出力トークンあたり8ドルです。 GPT-4.1ミニは、100万ドルあたり0.40ドルの入力トークン、100万ドルあたり1.60ドルです。 GPT-4.1 Nanoは、100万ドルあたり0.10ドル、100万件の出力トークンあたり0.40ドルです。
強化された命令フォローと長いコンテキストの理解
openaiは、指示に従い、長いコンテキスト入力を理解するモデルの能力を改善することに焦点を当てています。 GPT-4.1モデルは、広範なコンテキストウィンドウをより適切に利用し、最大100万トークンをサポートするように設計されており、改善された長いコンテキストの理解を示しています。これらの機能強化により、ソフトウェアエンジニアリング、ドキュメント分析、カスタマーサポートなど、ユーザーに代わってタスクを独立して達成できるAIエージェントを強化するためのモデルがより効果的になります。
Openaiによると、「信頼性と長いコンテキストに続いてこれらの指導の改善は、GPT-4.1モデルがGPT-4.1モデルをかなり効果的に効果的にします。 width=”1005″height=”605″src=”data:image/svg+xml; nitro-empty-id=mtc1ntoxmdq3-1; base64、phn2zyb2awv3qm94psiwidagmtawnsa2md uiihdpzhropsixmda1iibozwlnahq9ijywnsigeg1sbnm9imh0dha6ly93d3cudzmub3jnlziwmdavc3znij48l3n2zz4=”>
モデルの制限と考慮事項
GPT-4.1モデルは意味のある進歩を提供しますが、Openaiは特定の制限を認めています。モデルは、以前のバージョンよりもリテラルである可能性があり、ユーザーからより具体的で明示的なプロンプトが必要な場合があります。さらに、入力トークンの数が増えるとモデルの精度が低下します。 Openai独自のテストでは、精度は約84%から8,000トークンで1,024トークンで50%に低下しました。公式の投稿で、同社は次のように述べています。「初期のテスターは、GPT ‑ 4.1はより文字通りになる可能性があるため、プロンプトで明示的かつ具体的になることをお勧めします。」
さらに、GPT-4.5プレビューモデルは2025年7月14日に廃止され、GPT-4.1の幅広い採用に貢献します。新しいモデルには、2024年6月の知識カットオフがあり、開発者は以前のバージョンと比較してより多くの現在のデータにアクセスできます。