Qodoコマンドは71.2％のSWEベンチスコアでAIコーディングエージェントウォーズに入ります

AIスタートアップQodoは、優位性をコーディングするために激しい「ベンチマーク戦争」に参加しました。 8月11日、同社は新しいエージェントであるQodo Commandを発表し、SWEベンチ検証テストで印象的な71.2％を獲得しました。この結果は、Qodoが人類やOpenaiのような巨人が支配する競争の激しいアリーナに直接突き刺さっています。 QodoコマンドはLanggraph上に構築されており、タスクをコーディングするためにOpenai、人類などのモデルを使用できます。

この発表は、1回の態度のめまいがする週に続きます。人類とOpenaiは最近、トップの座を互いに飛び越え、それぞれ74.5％と74.9％のスコアを主張しました。ベンチマークの支配のための容赦ないレースは急速にエスカレートしています。

このハイステークス競争は、現実世界のつまずきの背景に対して展開されます。 Openaiの新しいGPT-5などの高得点モデルは、問題のある公開発売に直面しており、ベンチマークの成功が信頼できる生産対応のパフォーマンスに真に変換されるかどうかについて重要な疑問を提起しています。 Swe-bench gauntlet:隔週で新しいコーディングワールドチャンピオン

業界のトップラボからのこのラピッドファイアシリーズのアナウンスは、a

Qodoコマンドは71.2％のSWEベンチスコアでAIコーディングエージェントウォーズに入ります

Published by All Things Windows on August 12, 2025

IT Info

Windows 11 24H2 8月更新KB5063878には、新しいスナップ、スタートメニュー、検索、その他多くの機能がもたらされます。ダウンロードリンク。

IT Info

Googleは「優先ソース」を起動して、ユーザーが検索中のニュースアウトレットに優先順位を付けることができます

IT Info

リフレクターメディアはデジタル市民を買収しました。次に何が起こりますか?

Qodoコマンドは71.2％のSWEベンチスコアでAIコーディングエージェントウォーズに入ります

Published by All Things Windows on August 12, 2025

Related Posts

IT Info

Windows 11 24H2 8月更新KB5063878には、新しいスナップ、スタートメニュー、検索、その他多くの機能がもたらされます。ダウンロードリンク。

IT Info

Googleは「優先ソース」を起動して、ユーザーが検索中のニュースアウトレットに優先順位を付けることができます

IT Info

リフレクターメディアはデジタル市民を買収しました。次に何が起こりますか?