中国のAIラボDeepseekは、数学の定理を対象とした非常に大きな言語モデルであるDeepseek-Prover-V2-671Bをリリースし、このリリースは、特に米国からの激しい地政学的精査をナビゲートし、2022年後半から導入されている高度なコンピューティングハードウェアの米国輸出制御の締め付けに適応することに適応します。米国およびヨーロッパの規制の引き締めとOpenai、Google、人類、Xai、およびAlibabaとの競争の強化と戦う際の早期に計画された展開。計算効率。同社は、Multi-Head Latent Anteress(MLA)などの手法を組み込みました。これは、長いデータシーケンスを効率的に処理するために設計されたアプローチ(V3 Baseモデルで最大128,000トークン)とFP8量子化、メモリニーズを削減する低精度数値形式をモデルアーキテクチャに入れます。 src=”https://winbuzzer.com/wp-content/uploads/2025/01/deepseek.jpg”>

この効率の焦点は、Flashmla注意カーネルや3FS分散ファイルシステムの財団の可能性の高いファイルシステムのようなFlashmlaの注意材のような財団のようなFlashmlaの注意材のようなdeepseekオープンソースインフラストラクチャツールの場合、以前に強調されていました。 テクニカルレポート

deepseek-prover-v2-671bは、一般的なチャットボットではなく、特に deepseek-prover-v1.5 を含む、Deepseekの以前の作業に基づいています。 href=”https://arxiv.org/abs/2405.14333″ターゲット=”_ blank”> prover work (2024年5月)。 

このアプローチは、他の最近の有名な数学AIシステムとは異なります。 Google DeepmindのAlphageometry2は、最近、国際数学的オリンピアード(IMO)の幾何学の問題に関する人間の金メダリストを上回り、微調整されたジェミニ言語モデルと専用のシンボリック推論エンジン(DDAR)を組み合わせたハイブリッドアーキテクチャを採用しています。

Alphageometry2は、競争スタイルの幾何学の問題に関するパフォーマンスを実現するために、膨大な量の合成トレーニングデータ(3億人以上の定理と証明)を生成することにも大きく依存していました。 Deepseekの以前のProverモデル( v1.5 および v133″そして、補強補助補助食品フィードバック(RLPAF)およびモンテカルロツリー検索(MCTS)バリアントからの強化学習などの手法は、Prover V2が同様の方法に基づいて構築される可能性が高いことを示唆しています。 MCTSなどのテクニック、コードを獲得したチェーン(COT)推論(自然言語と検証可能なPythonコードの両方を生成)、および中間ステップを評価するプロセス選好モデル(PPM)を使用して、70億パラメーターモデルを有効にして、GSM8KやMATのようなベンチマークのベンチマークの高精度を実現します。ハイブリッドシンボリック/ニューラルアプローチを備えたオリンピアードジオメトリをターゲットにするアルファオゲメトリー測定をターゲットにし、RSTAR-MATHをより広範な数学推論タスクのより広い数学の推論タスクのために小規模なモデルを最適化します。生態系。

地政学的な十字線に巻き込まれた

リリースは、deepseekが激しい規制行動に直面すると発生します。 2025年初頭、米海軍はセキュリティリスクよりも使用を禁止し、その後、テキサス州が州政府のデバイスでチャットボットアプリを禁止することがまもなく続きました。この圧力は、「Deepseek Unmasked」というタイトルの米国下院選考委員会からの4月16日の報告書によって大幅に増幅されました。委員会は、会社に国家安全保障上のリスクとラベル付けしました。

委員会委員長のジョン・ムーレナールは、「この報告書は明らかにしています。ディープセックは単なるAIアプリではありません。アメリカ人をスパイし、技術を盗み、米国の法律を覆すように設計された中国の共産党の武器です。」詳細な深刻な申し立てを報告し、deepseekがアメリカのユーザーデータを中国に戻し、href=”https://www.fck.gov/document/fcc-denies-mobile-telecom-services-application”target=”_ blank> State-owned Mobile

委員会はまた、Deepseekが「数万」の高度なチップを買収し、米国の輸出法に違反する可能性があると主張しました。 Nvidiaは、販売情報を特定のアジア諸国に開示して、エンドユーザーを追跡します。 Furthermore, the report highlighted intellectual property concerns, referencing testimony from OpenAI and findings from Microsoft security researchers suggesting DeepSeek personnel may米国モデルのセーフガードを回避することにより、モデル蒸留などのテクニックを不適切に使用しています。 28、2025)は、これらの実質的なセキュリティと地政学的な課題の影に直接発生します。

Categories: IT Info