Openaiは、これまでで最も強力で開発者中心のAIモデルファミリであるGPT-5を発売しました。木曜日にAPIを介してリリースされたこの新しいフラッグシップモデルは、コーディング、ツールの使用、複雑な推論における最先端のパフォーマンスを提供します。発売の目的は、開発者に、より能力があり、信頼性が高く、効率的なAIを提供することにより、GPT-5、GPT-5-MINI、GPT-5-NANOの3つのサイズで利用可能なより能力があり、効率的なAIを提供することを目的としています。新しいシリーズは、パフォーマンスとコストの柔軟なバランスを提供します。この階層化された戦略は、ますます競争の激しい市場に対する直接的な対応であり、ハイエンドのエージェントタスクから低遅延の運用への開発者のニーズに対処します。開発者市場全体をキャプチャするための明確な意図を示しています。 (SOTA)いくつかの主要な開発者ベンチマークに記録。このモデルは、SWEベンチ検証で74.9%を記録しました。これは、実際のソフトウェアエンジニアリングの問題を解決するためにAIが必要とするテストです。特に、これは前身よりも22%少ない出力トークンで達成します。
コーディングの習熟度のこの飛躍は、リリースの中心的な焦点です。多言語コード編集を評価するAider PolyGlotベンチマークでは、GPT-5は記録的な88%の成功率を達成しました。これは、AnthropicのClaude 4.1 OPUSなどの以前のモデルや競合他社と比較してエラーの大幅な減少を表しています。
モデルのインテリジェンスは、コードを作成するだけでなく、複雑なマルチステップタスクを理解して実行することにまで及びます。最近公開されたτ²-ベンチテレコムベンチマーク、GPT-5は例外的な96.7%を獲得し、高度なツールの能力を有効にしています。ヴェルセルはモデルを賞賛し、「これは最高のフロントエンドAIモデルであり、美的感覚とコードの品質の両方で最高のパフォーマンスを打ち、独自のカテゴリに入れます」と述べました。同様に、コード編集プラットフォームカーソルは、モデルが「非常にインテリジェントで、操縦しやすく、他のモデルでは個性を持っていない」とさえ発見しました。 Windsurfはまた、モデルには、信頼できる自動化のための重要なメトリックである「他のフロンティアモデルにわたってツール呼び出しエラー率の半分がある」と報告しました。 src=”data:image/svg+xml; nitro-empty-id=mty1ntoxnda1-1; base64、phn2zyb2awv3qm94psiwidagmte3mca4nzui ihdpzhropsixmtcwiibozwlnahq9ijg3nsigeg1sbnm9imh0dha6ly93d3cudzmub3jnlziwmdavc3znij48l3n2zz4=”>
カスタマイズされたAPI応答の粒状制御
Openaiの戦略の重要な部分は、開発者がモデルの動作をより直接的に制御できるようにすることです。新しいReasoning_effortパラメーターを使用すると、開発者は応答の品質と速度のトレードオフを管理できます。これは、インスタント近くの回答の「最小」設定で、
レスポンシブユーザーエクスペリエンスを作成するために重要です。新しい冗長パラメーターは、応答の長さを管理するのにも役立ち、複雑な迅速なエンジニアリングなしで特定のユースケースに出力が適切に簡潔または包括的であることを確認します。この機能により、開発者はSimple Plantextを使用してツールを定義し、厳格なJSONフォーマットの必要性をバイパスできます。この変更は、特に慎重なキャラクターの脱出を必要とするコードまたはテキストの大きなブロックを渡すときにエラーを減らすように設計されています。フラッグシップGPT-5モデルの価格は、100万ドルあたり1.25ドル、出力は10.00ドルです。これにより、アプリケーションを要求するための高性能オプションとして位置付けられます。
開発者には、効率性に優先されるため、GPT-5-MINIは、入力でわずか0.25ドル、出力で2.00ドルで魅力的なバランスを提供します。最もアクセスしやすい層では、GPT-5-Nanoは低遅延のユースケースで最適化されており、入力はわずか0.05ドル、出力トークンで0.40ドルで、小規模なオープンソースモデルと直接競合しています。開発者がパフォーマンスの要件と予算の制約に基づいてアプリケーションをスケーリングする明確な経路を提供し、OpenAIが市場のあらゆるセグメントに提供することを保証します。 OpenAIは、モデルがLongfactやFactScoreなどのベンチマークの前身よりも約80%少ない事実上の誤りを行っていると報告しています。これは、信頼できるアプリケーションを構築するための重要な改善です。 Manusのようなエンタープライズテスターからのフィードバックはこれを確認し、モデルは「内部ベンチマークで単一のモデルから見た中で最高のパフォーマンスを達成した」と述べた。この改善された推論は、AIが複雑なビジネス上の問題に対して信頼できる洞察に満ちた出力を提供する必要があるエンタープライズの採用にとって重要です。
モデルの発売は、MicrosoftとのOpenaiのパートナーシップと密接に結びついています。 GPT-5は、Azure AIやGithub Copilotなど、Microsoftのプラットフォーム間ですでに統合されています。これにより、大規模な開発者ベースの即時の可用性が保証され、エンタープライズエコシステムにおけるその役割が固まります。