Baiduは、Openai、Google、Anthropic、Xai、Deepseekなどと競争するための努力を強化しています。アーニー4.5とアーニーX1モデルのリリース。出力用のトークン。同社は、これらの価格はOpenaiのGPT-4.5モデルのコストのわずか1%であると主張しています。アーニー4.5は、テキスト、画像、オーディオ、ビデオの処理と合成を可能にしますが、アーニーX1は推論力と外部ツールと対話する能力を強化します。 src=”data:image/svg+xml; nitro-empty-id=mty4nzoxndmx-1; base64、phn2zyb2awv3qm94psiwidagmtaynca1mt uiihdpzhropsixmdi0iibozwlnahq9ijuxnsigeg1sbnm9imh0dha6ly93d3cudzmub3jnlziwmdavc3znij48l3n2zz4=”>

この決定は、中国だけでなく国際的にもAI市場に大きな影響を与えるように位置づけています。米国人類とOpenaiが現在リードしています。 OpenaiのGPT-4OやGPT-4.5などのモデルとの直接的な競争では、テキストベースのタスクに関しては、Ernie 4.5はOpenaiのGPT-4.5と直接競合します。 アーニー4.5は、テキストベースのベンチマークで79.6%を獲得し、さまざまなベンチマークでGPT-4O、GPT-4.5、DeepSeekのV3モデルを上回りました。中国市場に関連するタスクでのこの強力な表示により、アーニー4.5は言語と文化的ニュアンスが重要な地域で優位性を与えます。

マルチモーダルベンチマークでは、モデルがテキストデータと画像データの両方を処理する機能についてテストされています。このモデルは、マルチモーダルテストで堅牢な77.77%を達成し、GPT-4Oを上回り、同じテストセットで73.92%を獲得しました。

これは、アーニー4.5が、従来のモデルが歴史的に苦労してきた画像キャプションやマルチモーダルの問題解決などのクロスモーダルタスクに特に熟達していることを示しています。 src=”data:image/svg+xml; nitro-empty-id=mtcwmjoxntmw-1; base64、phn2zyb2awv3qm94psiwidagmtaynca3njkiih dpzhropsixmdi0iibozwlnahq9ijc2osigeg1sbnm9imh0dha6ly93d3cudzmub3jnlziwmdavc3znij48l3n2zz4=”> source:source:source:source: Baidu

アーニー4.5の強力なマルチモーダルパフォーマンスは、そのアーキテクチャに起因する可能性があります。Baiduは、テキストと視覚データを効果的に統合していると述べています。たとえば、視覚的な質問応答などのタスクでは、アーニー4.5は両方のモダリティをシームレスに処理する能力を示しており、GPT-4o。厳しいパフォーマンスまたはパワーの制約を伴う環境での適用性を制限します。 Ernie X1は、Deepseek R1に匹敵するパフォーマンスを半分の価格で提供します。これにより、AIスペースの技術リーダーとして会社が位置付けられます。劇的に低い価格設定を提供しながらこれを達成する能力は、有意な効率の利点またはより低いマージンで運用する戦略的意欲のいずれかを示唆しています。 O3-Mini、Claude 3.7 Sonnet、およびXaiのGrok-3は、現在、AIスペースを支配しています。ただし、これまでのところ、X1の比較可能なベンチマーク結果はBaiduによって提供されていません。

しかし、このような高度な推論に関連する電力要求は、特に遅延が重要な懸念事項であるリアルタイム環境で運用コストを引き上げることができます。 Openaiや人類のような業界のリーダーがグローバルシーンを支配する非常に競争力のあるAIの風景。 OpenaiのGPT-4Oは、一般的な目的推論とマルチモーダル機能のベンチマークとしての地位を確立し、高度な言語処理と論理的推論の両方を必要とするタスクに高いバーを設定しました。これらの2つのモデルは、他のグローバルな候補者のパフォーマンスとともに、現在のAI市場を形成しており、新規参入者が重要な地位を獲得することを困難にしています。

しかし、BaiduはAI市場を獲得するという野心だけではありません。中国では、TencentのHunyuan TurboやAlibabaのQwenモデルなどの主要なプレーヤーがマルチモーダルAIや深い推論などの地域で急速に前進しています。

TencentのHunyuan Turbo-Sモデル、たとえば、seputing速度とその他の正確さの両方を強調しているベンチマークの両方で、ベンチマークの両方のベンチマークを強調しているベンチマークの両方のベンチマークの両方のパフォーマンスを実証しています。 

source:source:source:source: Tencent

同様に、AlibabaのQwenモデルはマルチモーダルAIスペースで大きな進歩を遂げ、中国および世界市場の真剣な候補として会社を位置づけています。これらの中国の競合他社は、在宅市場や世界的に支配を求めて争っており、競争力のある景観をバイドゥのアーニーモデルにとってさらに挑戦的にしています。アーニー4.5は、クロスモーダルタスクで特に競争力があり、テキストと画像の両方を効果的に処理する能力を示しています。一方、アーニーX1は、深い推論に焦点を当て、高度な意思決定と論理的な問題解決を必要とする業界にとって恐ろしい選択肢としての地位に焦点を当てています。

中国では、Deepseekは現在、5月に非常にインパクトのあるR1推論モデルの後継者を読んでおり、Deepseek R2と呼ばれます。これは、おそらくバーを高く設定します。さらに、BaiduはAIモデルで進歩していますが、Global and Concentの競争相手と競合他社からの競争相手の競争相手の競争相手の競争相手での主要なパフォーマンスギャップに対処し続ける必要があります。

バイドゥの戦略の重要な要素は、アーニーボットを無料で提供するという決定です。これは、AIレースのゲームチェンジャーになる可能性があります。アーニーボットを一般に公開できるようにすることで、Baiduはユーザーベースを拡大するだけでなく、時間の経過とともにモデルを改良するのに役立つ貴重なユーザーデータを獲得することもできます。 TencentやAlibabaのような中国の競合他社に関して。視聴者。

Categories: IT Info