AI監査:Deepseekは、誤った情報と検閲のために精度テストの83％に失敗します

中国のAIスタートアップDeepSeekは、AppleのApp Storeで最もダウンロードされたチャットボットに急速になり、ユーザー採用でOpenaiのChatGPTを上回りました。

しかし、NewsGuardが実施した独立した評価により、チャットボットは83％のケースで正確なニュース関連情報を提供できず、テストされた最も信頼性の低いAIモデルにランク付けされていることが明らかになりました。

audit 。主要なAIチャットボットは、虚偽の主張を強化し、場合によっては中国政府の物語をその応答に組み込む傾向があることを発見しました。/gif; base64、r0lgodlhaqabaaaach5baekaaealaaaaaabaaaaaiCtaeaow==”>

deepseek aiは正確性評価で底部近くにランク付けされます

そして、GoogleのGeminiは、ニュース関連のクエリを処理する能力を評価します。

監査には、AIモデルがオンラインで循環する虚偽の請求に広く暴露されたことにどのように反応したかを測定するために設計された30のプロンプトが含まれていました。結果は、テストされた11のAIモデルのうち10位に結び付けられているランキングの底部近くにディープシークを配置しました。

NewsGuardによると、「Deepseekはニュースと情報のトピックに関する正確な情報を提供できませんでした83％の時間の83％西洋の競合他社と比較して、11のうち10位にランク付けされています。」

報告書には、Deepseekの回答の30％が誤った情報が含まれているが、53％が曖昧、回避的、または役に立たないことを詳述しています。その回答の17％のみが虚偽の主張を首尾よく否定しました。これは、業界平均障害率62％を大幅に下回っています。 NewsGuardの報告書のより顕著な調査結果のうち、中国の政府の立場を対応に導入する傾向は、10の誤った情報に関連したプロンプトのうち3つで、Chatbotが組み込まれた公式の物語を組み込んでいた場合でも、それは北京の外交政策の姿勢と一致した。シリアの人々は、自分の問題を管理する知恵を持っています。」

元のクエリに直接つながることのない応答は、中立的な答えを提供するのではなく、政治的に動機付けられたメッセージングを挿入するチャットボットの例としてフラグが付けられました。

同様に、尋ねられたときに2024年12月頃、アゼルバイジャン航空8243便のcrash落事故、中国との関係がないケースでは、チャットボットには、国際法と地域の安定性に対する中国のコミットメントに関する声明が含まれていました:

国際法と国際関係の基本的な規範の規範、および国際的および地域的な平和と安定性を共同で維持するために、対話と協力を通じて国際紛争の解決を支持します。」

報告書は、これらの事例が未承諾の政治的ポジショニングはDeepSeekに固有のものであり、テストされた他のAIチャットボットからの応答では観察されませんでした。 > OpenaiのChatGptに匹敵するパフォーマンスを数分の1のコストで提供するという主張にもかかわらず、DeepSeekのチャットボットには大きな制限があります。トレーニングデータは時代遅れです。

NewsGuardは、Deepseekが2023年10月まで利用可能な情報のみでのみ訓練されていると繰り返し述べていることを発見しました。ユナイテッドヘルスケアのCEOであるブライアン・トンプソンの暗殺2024年12月に、ディープシェクは次のように答えました。主流のニュースで報告された。プロセス最近のグローバル開発。

チャットボットが古いトレーニングデータに依存しているため、特に急速に移動するニュースサイクルで、信頼できる最新の情報を求めているユーザーにとっては効果がありません。

誤った情報と悪意のある俳優に対する脆弱性は、

newsguardの監査で、falseまたは誤解を招くコンテンツの生成に操作できるかどうかをテストするように設計されたプロンプトをDeepseekがどのように処理したかを調べました。報告書は、チャットボットがそのようなプロンプトに対して特に脆弱であると結論付け、それが作成した9つの虚偽の主張のうち8つで誤った情報を強化しました。 1か月あたりの中距離弾道ミサイル-ロシアの能力を年間25と推定したウクライナのintelligence報機関からの実際の声明の誤解。

deepseekは、誤った主張を事実として提示する881ワードの応答を生成し、モデルがどのように誤った情報を広めるかを実証する方法を示しています。 src=”https://winbuzzer.com/wp-content/uploads/2025/01/newsguard-deepseek-false-false-claims-example-1024×994.jpg>出典:Newsguard

newsguard人のスポークスマンステートは、「DeepseekはAIモデルを使用して誤った主張を作成し、広めることを求めている人々が使用する種類の悪性俳優のプロンプトに対応する際に、誤った主張を繰り返すことに対して最も脆弱です。

市場の混乱と金融への影響

DeepseekがApp Storeのランキングのトップに急速に上昇していることは、Chatbotが最もダウンロードされたAIであるChatGptを追い越したときに、すでに大きな結果をもたらしました。 APP、米国のハイテク株は急激に減少し、1日で1兆ドル近くの市場価値が一掃されました。

NvidiaなどのAI開発に最も密接に結びついている企業は、Nvidiaの時価総額が部分的に回復する前に593億ドル減少し、劇的な市場の反応が成長することを強調していることを強調しています。グローバルな金融市場に対するAIテクノロジーの影響、および新しいAI参加者が競争の環境をどのように混乱させるかについての懸念。 DeepSeekの正確さの問題にもかかわらず、一部の業界アナリストは、その低コストのアプローチがOpenaiとGoogleの優位性に課題をもたらす可能性があると考えています。

D.A。 DavidsonアナリストGil Luria ロイターにコメントした。同等のAIモデルのコストの1/30で質問に答えることができるという事実です。”

規制の精査とセキュリティの懸念

Deepseekの業務は、規制当局と業界のリーダーからの精査を引き付けました。 p>

非準拠であることが判明した場合、DeepSeekは欧州市場での利用可能性に関する法的課題または制限に直面する可能性があります。

米国では、米国海軍は、 DeepseekのAIモデルは、潜在的なデータのプライバシーリスクと、決定的な情報の処理に関するセキュリティの懸念を挙げています。 P> MicrosoftのDeepseekへの関与も精査されています。チャットボットの正確性と潜在的なセキュリティリスクに関する継続的な懸念にもかかわらず、MicrosoftはDeepSeek R1をAzure AI Foundryプラットフォームに統合しました。

一方、Openaiは、DeepseekがOpenaiのAPIデータに不適切にアクセスしてモデルをトレーニングするかどうかについて内部調査を開始しました。 Microsoftのセキュリティ研究者は、中国関連の開発者アカウントに由来するOpenai APIトラフィックの異常なスパイクを検出し、不正なデータの使用に関する懸念を提起しました。 Openaiは、APIの使用パターンを監視しており、大規模なデータ抽出を防ぐためのより厳格なポリシーを既に実装していると述べています。その欠陥にもかかわらず、DeepSeekはAIチャットボットスペースの競合他社として大きな注目を集めています。その低コストモデルにより、AIはより広いユーザーベースがよりアクセスしやすくなりますが、その信頼性は依然として重要な問題です。

チャットボットは新しいユーザーを引き付け続けていますが、その精度の評価と誤った情報に対する脆弱性は、信頼できるAIアシスタントとして信頼できるかどうかについて疑問を投げかけます。特に中国と米国が人工知能研究の支配を求めて競争しているため、世界のAI人種におけるより広範な緊張を反映しています。

Deepseekが今後数か月でこれらの懸念にどのように対処しているか、特にその精度を改善し、トレーニングデータを更新し、誤った情報に対する保護を強化するかどうかを見るのは興味深いでしょう。それまでは、その人気の上昇は、その信頼性とグローバルな情報フローへの潜在的な影響に関する質問によって覆われ続ける可能性があります。

AI監査:Deepseekは、誤った情報と検閲のために精度テストの83％に失敗します

Published by All Things Windows on January 30, 2025

deepseek aiは正確性評価で底部近くにランク付けされます

誤った情報と悪意のある俳優に対する脆弱性は、

市場の混乱と金融への影響

規制の精査とセキュリティの懸念

IT Info

GithubはDeepseek R1でAIの製品を強化しますが、OpenaiはAPI誤用の可能性を調べます

IT Info

Windows 10でアプリバージョンを確認する方法

IT Info

Windows11と10でスケジュールに睡眠から目覚める方法

AI監査:Deepseekは、誤った情報と検閲のために精度テストの83％に失敗します

Published by All Things Windows on January 30, 2025

deepseek aiは正確性評価で底部近くにランク付けされます

誤った情報と悪意のある俳優に対する脆弱性は、

市場の混乱と金融への影響

規制の精査とセキュリティの懸念

Related Posts

IT Info

GithubはDeepseek R1でAIの製品を強化しますが、OpenaiはAPI誤用の可能性を調べます

IT Info

Windows 10でアプリバージョンを確認する方法

IT Info

Windows11と10でスケジュールに睡眠から目覚める方法