Alibabaは、7月4日にリリースされた新しいオープンソースのWebエージェントであるWebsailorとのグローバルAIレースを加速しています。TongyiLabによって開発されたWebSailorは、ほとんどの現在のモデルを困惑させる非常に複雑な情報を求めるタスクを習得するように設計されています。同社は、エージェントがOpenaiなどの競合他社からの主要な専有システムとのパフォーマンスギャップを閉じていると主張しています。この戦略的リリース、 githubで利用可能は、激しく競争力のあるオープンソースAI ecosystemの激しく競争力のあるオープンソースAI ecosystemの激しく競争力のあるオープンソーシェの位置を固めようとすることを目指しています。推論
Websailorの中心にあるのは、モデルを曖昧さの処理方法を教えるために設計された洗練されたトレーニング戦略です。このアプローチは、単純な質問を超えて移動し、代わりに研究者が「レベル3」の問題と呼ぶものに焦点を当てています。深い探索を必要とする明確なソリューションパスのないタスク。 src=”data:image/svg+xml; nitro-empty-id=mty0mjoxndy2-1; base64、phn2zyb2awv3qm94psiwidagmty1niaxntey IIB3AWR0AD0IMTY1NIIGAGVPZ2H0PSIXNTEYIIIB4BWXZ0IAHR0CDOVL3D3D3D3DY53MY5VCMCVMJAWMC9ZDMCIPJWVC3ZNPG==”>
このデータは2段階のトレーニングレジメンで使用されます。それは、微調整(RFT)「コールドスタート」をサンプリングして、基本的なスキルを構築することから始まります。これに続いて、カスタムアルゴリズムを使用した強化学習、サンプリングポリシーの最適化(DUPO)を複製し、エージェントの探索戦略を効率的に改良します。公開されたベンチマークによると、モデルの72Bバージョンは、英語と中国語の両方で困難なBrowseCompテストのトップスコアを達成します。
中国語版のベンチマークでは、Websailor-72Bが30.1を獲得し、Doubao-searchのような独自のエージェントと同等のパリティを達成し、他のオープンスルースモデルを有意に拡大します。英語のテストでは、12.0を獲得しました。研究者は、「WebSailorは、複雑な情報を求めるタスクのすべてのオープンソースエージェントを大幅に上回り、独自のエージェントのパフォーマンスを一致させ、能力のギャップを閉じる」と主張しています。この論文は、控えめなWebSailor-7Bモデルが、はるかに大きな32Bモデルに基づいて構築されたエージェントを決定的に上回ることを強調しており、新しいパラダイムの有効性を強調しています。非常に困難な問題の訓練を受けているにもかかわらず、WebSailorは、よりシンプルな事実ベースのSimpleQAベンチマークの他の方法を上回り、その高度な推論スキルが多用途であり、基本的なタスクでパフォーマンスを妥協しないことを示しています。それは、ハイテクの巨人が市場シェアを獲得するために彼らの仕事を積極的にオープンソーシングしている中国の激しい「100モデルの戦争」の中に着陸します。この動きは、Alibabaを上級のオープンAI開発のリーダーとして戦略的に位置付けています。
競争緊張は、研究グループがHuaweiの新しいPanguモデルがAlibabaのQwenモデルのコピーであると主張したときに最近強調されました。 Huaweiの研究室は、モデルは「…他のメーカーのモデルの増分トレーニングに基づいていない…」と独立して開発されたと述べています。米国の制裁により最高層のハードウェアへのアクセスが制限され、中国企業が自立したエコシステムを構築するように強制するため、このプッシュはより広範な地政学的圧力によって促進されます。 AppleのAIがAlibabaとの契約を結んだときに見られるように、主要なパートナーシップは国際的な精査に直面しています。これにより、中国のハイテク大手は、国内の競争とグローバルな政治の複雑な風景をナビゲートすることを強制します。