中国のテクノロジー大手、Baidu は、木曜日に北京で新しい主力 AI モデルである ERNIE 5.0 を発表しました。
同社は、Baidu World 2025 イベントでこのシステムを発表しました。テキスト、画像、オーディオ、ビデオを一緒に処理するように構築されています。
Baidu は、その 2 兆 4000 億パラメータのモデルが、重要なビジネス タスクにおいて OpenAI の GPT-5.1 などのトップ ライバルを上回ると主張しています。これには、複雑な文書やグラフの理解も含まれます。
このリリースは、世界のエンタープライズ AI 市場を獲得するための戦略的な動きです。 Baidu が AI 製品を世界中に拡大する中で、強力な自社開発のオプションを提供します。
ERNIE 5.0 がドキュメントとチャートの優位性でエンタープライズ AI の王冠を主張
Baidu World 2025 イベントで発表されたこの新しいモデルは、世界的な AI 軍拡競争における重要な一歩を表しています。
ERNIE 5.0 は独自のネイティブ オムニモーダルです。テキスト、画像、音声、ビデオにわたるコンテンツを共同で処理および生成するためにゼロから設計されたシステムです。
最大 2 兆 4000 億のパラメータの規模が報告されており、これは Baidu のモデル ファミリーの複雑さにおける大きな飛躍を示しています。
西側の AI リーダーに対する直接的な挑戦として、Baidu は ERNIE 5.0 をエンタープライズ アプリケーション向けの優れたツールと位置づけました。
同社は、このモデルが特に OpenAI の最新の GPT-5.1 や Google の Gemini 2.5 Pro を上回るか、それに匹敵することを示唆するベンチマークを発表しました。
Baidu は、OCRBench や DocVQA などのテストでトップスコアを獲得したことを引用して、文書理解において明確な優位性があると主張しています。また、ChartQA ベンチマークでのパフォーマンスを示し、構造化データ推論におけるリーダーシップを主張しています。
Baidu ERNIE 5.0 テキスト ベンチマーク
エンタープライズ クリティカルなタスクに焦点を当てていることは、単に一般的な会話能力ではなく実用性で競争するという Baidu の戦略を示しています。
自動化された文書処理や財務分析を扱う企業にとって、これらの機能は中核的な要件です。
百度ERNIE 5.0 Visual Understanding ベンチマーク。
このモデルは現在、Baidu の Qianfan クラウド プラットフォーム API を通じて企業クライアントに利用可能であり、ERNIE Bot Web サイトを通じて一般公開されています。
しかし、発売には問題がなかったわけではありません。 AI 評価者の Lisan al Gaib 氏は、賛否両論のレビューを投稿し、
「テストするまで、ERNIE 5.0 ベンチマークは非常識に見えました…残念ながら RL が脳に損傷を負っているか、チャット プラットフォーム/システム プロンプトに重大な問題を抱えています。」
Baidu の開発者サポート アカウントはすぐに 返信し、
「フィードバックありがとうございます。これは既知のバグです。特定の構文が常にこの問題を引き起こす可能性があります。修正に取り組んでいます。プロンプトを言い換えたり変更したりしてみてください。」
デュアルトラック戦略: プレミアム API とオープンソース代替品
ERNIE 5.0 は、Baidu の価格体系のプレミアムエンドに位置しており、中国の AI 市場を定義してきた積極的な値下げから意図的に離れています。
API アクセスの価格は、100 万あたり約 0.85 ドルです。入力トークンと 100 万出力トークンあたり 3.40 ドルで、予算の代替品ではなく、他の最上位モデルと一致しています。
これは、Baidu が複雑でマルチモーダルな推論タスクに対するモデルの高機能パフォーマンスに自信を持っていることを示唆しています。
このプレミアム戦略は、オープンソース コミュニティにおける Baidu の最近の活動とは明らかに対照的です。 ERNIE 5.0 のリリースの数日前に、Baidu は、寛容な Apache 2.0 ライセンスの下でマルチモーダル モデルである ERNIE-4.5-VL をリリースしました。
この二重トラック アプローチにより、Baidu は主力製品で両方の大企業にアピールできます。
BAidu の戦略は、画一的なアプローチではもはや十分ではない成熟市場を反映しています。ハイエンドで完全にサポートされた製品と、柔軟でオープンな代替製品の両方を提供することで、同社は AI エコシステムのさまざまなセグメントに対応できます。
CEO の Robin Li は、AI を中核的なビジネス機能にする必要性を強調することで、このビジョンを組み立てました。 「AI を内部に組み込むと、AI はネイティブな機能になり、インテリジェンスがコストから生産性の源に変わります」と同氏はイベントで述べました。
世界的な野心: Baidu が中国の国境を越えて AI エコシステムを推進
同社は、主力モデルと並んで、AI アプリケーション スイート全体に対する重要な国際的な推進について詳しく説明しました。
Baidu はいくつかの主要製品を世界市場に展開しており、そのことを示唆しています。国内のチャンピオンだけでなく、世界的な AI インフラストラクチャ プロバイダーになることを目指しています。これらの取り組みは、その基本モデルを中心とした包括的なエコシステムを作成するように設計されています。
そのノーコード アプリケーション ビルダーは、MeDo として世界中で利用可能になり、技術的な専門知識を持たないユーザーでも AI を活用したツールを作成できるようになります。
百度MeDo
Baidu はまた、生産性向上のためのワンストップ AI ワークスペースである Create を立ち上げ、既に世界中で 120 万人以上のユーザーを魅了しています。
さらに、中国で広く使用されている同社のデジタル ヒューマン テクノロジーがブラジルでデビューし、米国と東南アジアへの拡大を計画しています。
このエコシステムは、成長するユーザーベースによって支えられています。 Baidu の汎用 AI エージェントである GenFlow はバージョン 3.0 にアップデートされ、現在 2,000 万人以上のユーザーにサービスを提供しています。Baidu は、ユーザー数で世界最大のエージェントになったと主張しています。
この広範な採用により、基盤となるモデルを改良するための重要なデータとフィードバック ループが提供されます。
BAidu の戦略全体は、垂直統合の推進によって支えられています。 ERNIE 5.0 の発表は、Baidu の新しいカスタム Kunlunxin AI チップの発表と同時に行われました。このチップは、モデルを強化し、外国のハードウェアへの依存を減らすように設計されています。
Baidu にとって、シリコンからソフトウェアまでのフルスタックを所有することは、究極の競争上の優位性です。 Robin Li 氏が説明したように、「AI エージェント自体が最も重要なアプリケーションであり、技術の反復速度が唯一の競争の堀です。」
高度なモデルとグローバルな製品スイートを組み合わせたこの統合アプローチにより、Baidu は AI 導入の次の段階における手ごわい競争相手として位置づけられます。