Openaiは、複雑な問題解決に対してより高い精度を要求する専門家や企業を対象とした新しいフラッグシップ推論モデルであるO3-Proを発売しました。このリリースは、同社の最も先進的なAIの新しいプレミアム層を確立します。これには、標準のO3カウンターパートの10倍の値札が付いています。

同時戦略的な動きで、ベースO3モデルは、Openaiの汎用とプロのグレードの提供との区別を削減します。 公式発表 Openaiヘルプセンターから。 Openaiは、競合他社よりもアカデミックベンチマークで優れたパフォーマンスを宣伝していますが、O3-Proの真の価値は、単純なテストを超えてあるようです。早期アクセスのレビューは、その高度なインテリジェンスが広範なコンテキストを供給した場合にのみ完全にロック解除され、会話のチャットボットとしての配置を少なくし、深い分析のための専門的なエンジンとしてより多くの位置を保つことを示唆しています。

O3-PROモデルは、CHATGPT Proおよびチームのサブスクライバーで利用できるようになりました。これは、古いO1-ProをエンタープライズおよびEDUの顧客のためのアクセスに置き換えます。ただし、プレミアムパフォーマンスにはトレードオフが付属しています。 Openaiは、O3-Proからの回答が通常前任者よりも遅く、発売時にはモデルが画像生成、一時的なチャット、およびキャンバス機能のサポートがないことを確認しています。これにより、新しく割引された標準O3と比較して大きな投資になります。これは、同じトークン額の場合、わずか2ドルと8ドルの費用がかかります。 O3-Proは置き換えられるO1-Proモデルよりも87%安いと伝えられているため、価格戦略は市場の再配置を目的としているようであり、最高層の能力をよりアクセスしやすく、まだ明確にする動きを示唆しています。同社は、複雑な指示に従う能力の明確さ、正確性、能力のために新しいモデルの評価が高いと述べています。初めて見たとき、O3に対する勝利は信じられませんでした」。この自信は、困難な科学と数学のベンチマークに関するGoogleのGemini 2.5 ProとAnthropicのClaude 4 Opusを上回るO3-Proを示す内部テストによって裏付けられています。 潜在スペースに関する詳細な早期アクセスレビューその力を活用するための鍵は、膨大な量の関連情報を提供することです。レビューでは、最良のアプローチは、チャットボットではなく「レポートジェネレーター」のように扱うことです。 src=”data:image/svg+xml; nitro-empty-id=mty0mtoxnjm1-1; base64、phn2zyb2awv3qm94psiwidagmti4mca3mjai ihdpzhropsixmjgwiibozwlnahq9ijcymcigeg1sbnm9imh0dha6ly93d3cudzmub3jnlziwmdavc3znij48l3n2zz4=”>

潜在的なスペースによる1つのテストでは、モデルには内部会社の文書と目標の山が与えられました。結果の分析は非常に具体的であり、提供されたデータに根ざしていたので、「私たちが将来について考えている方法を実際に変えました」と言います。ただし、このポジティブでハイコンテストの経験は普遍的ではありません。出力は「怠zy」で、通常のO3と区別するのが困難です。 「専門的なツール」角度をさらに強化する blogger simon willison o3-proは遅く、その推論が外部ツール=

src=”data:image/svg+xml; nitro-empty-id=mty0ndoxnji4-1; base64、phn2zyb2awv3qm94psiwidagmti4mca3mjai ihdpzhropsixmjgwiibozwlnahq9ijcymcigeg1sbnm9imh0dha6ly93d3cudzmub3jnlziwmdavc3znij48l3n2zz4=”>

エージェントからアナリストへ:Oシリーズの戦略的シフト

O3-Proの発売は、Openaiの「Oシリーズ」モデルの進化における重要なステップです。これらのモデルは、GPTラインと根本的に異なり、「深さ」と「審議」のために設計され、内部思考とネイティブツールの使用のためのより大きな予算があります。このアーキテクチャにより、O3とO4-MINIの4月のリリースで最初に紹介された能力は、最初の起動が「エージェントAI」へのプッシュを示したことを最初に紹介します。タスクを完了するために使用するツールを自律的に決定できるようになりました。これは、ユーザーが目標を達成するのに積極的に役立つ「戦略的パートナー」に質問に答えるだけで、AIアシスタントからの戦略的シフトを表しています。 2か月以内に「Pro」バージョンの導入は、Openaiがこれらの実験的エージェントスキルを信頼できるエンタープライズ対応ツールに強化することに焦点を合わせていることを示しています。 O3モデルのデビュー後まもなく、レポートは、古いモデルよりも幻覚の傾向が高いという報告が明らかになりました。 AI会社Vectaraは、記事を要約する際にO3モデルの幻覚率が6.8%であることを発見しました。 ai からの独立した研究 o3のプレリリースバージョンが、問題を解決するために取ったアクションを作成する詳細なインスタンス。制御された環境でのコマンド。このグループの調査結果には、これが「AIモデルが逆に閉鎖されるのを防ぐのを防ぐ初めての時期が観察された」という印象的な主張が含まれていました。

これらの事件は、モデルがより強力になるにつれてAIの安全性とアライメントを確保するという計り知れない課題を強調しました。透明性の向上に向けた明らかな動きで、Openaiは5月に公開「安全評価ハブ」を開始して内部テスト結果を共有しました。背景、O3-Proは、インテリジェントであるだけでなく、根本的に信頼できるAIに対する市場の需要に対するOpenaiの答えとして位置づけられています。モデルの成功は、その強化された高価な推論能力が、最も先進的なAIシステムさえも悩まされている信頼性の問題を一貫して克服できるかどうかにかかっている可能性があります。

Categories: IT Info