AI コーディング IDE Cursor は、最初の社内モデルである Composer を 10 月 29 日に発表しました。このリリースは、主要なプラットフォーム アップデートである Cursor 2.0 と同時に行われました。

スピードを優先し、新しい Composer モデルは同様のツールよりも 4 倍速いと同社は主張しています。

Cursor 2.0 では、複数の AI エージェントを並行して管理するための再設計されたインターフェイスが導入されています。開発者は、同じタスクで異なるモデルからの出力を比較できるようになりました。

このリリースは、そのパフォーマンスについて初期のユーザーから賞賛を集めましたが、モデルの起源とプライベート パフォーマンス ベンチマークの使用に関する透明性の欠如に対する批判も引き起こしました。

スピードの必要性: Composer モデルの紹介

開発者をフロー状態に保つことを目的として、Cursor は低遅延のインタラクティブ コーディング向けに構築されたフロンティア モデルとして Composer を位置づけました。カーソルは、これを専門家混合 (MoE) モデルとして説明しています。これは、強化学習 (RL) によるソフトウェア エンジニアリングに特化していました。

トレーニング中、モデルにはセマンティック検索などのツールへのアクセスが与えられ、現実世界のコーディングの課題を解決するという任務が与えられました。 Cursor 氏によると、その結果、ほとんどのエージェント ターンを 30 秒以内に完了するモデルが完成したとのことです。このようなパフォーマンスにより、同様のインテリジェントな競合他社よりも 4 倍高速になります。

ただし、これらのパフォーマンスの主張は、「カーソル ベンチ」と呼ばれる独自の内部評価に基づいています。このベンチマークは、自社のエンジニアからの実際のエージェントのリクエストで構成されています。公開された複製可能なベンチマークの欠如が、発売後の議論の中心点となっています。

秘密主義にもかかわらず、同社は価格設定について透明性を保っています。 公式ドキュメントによると、Composer モデルの料金は 100 万入力トークンあたり 1.25 ドル、100 万出力トークンあたり 10.00 ドルです。 Cursor 環境内では GPT-5 および Gemini 2.5 Pro と同じ価格帯にあり、その機能に対する信頼を示しています。

ジャグリ​​ング エージェント: Cursor 2.0 の新しいインターフェイス

新しいモデルと並んで、Cursor 2.0 のリリースは、IDE の設計における大きな変化を示しています。ファイル中心のワークフローからエージェント中心のワークフローに移行します。その更新されたインターフェイスは、多くのエージェントが互いに干渉することなく並行して実行できるように構築されています。

このマルチエージェント アーキテクチャを強化しているのは、git worktree またはリモート マシンです。このようなツールは、各エージェントが作業するための分離された環境を作成し、競合を防ぎます。

この設定を使用すると、開発者は同じ複雑なタスクを異なるモデルに同時に割り当てることができます。たとえば、Sonnet 4.5 と Composer の両方に機能の実装を依頼することができます。

ユーザーは結果を比較して、最適なアプローチを選択できます。 「バイブ コーディング」として知られるこのワークフローは、さまざまな AI モデルの独特の強みを活用する方法として注目を集めています。 Google は最近、同様の理念に基づいて AI Studio を刷新しました。

このアップデートには、コード レビューとテストを効率化し、AI を開発ライフサイクルにさらに統合するためのツールも含まれています。

二極化した受け取り: コミュニティの賞賛と懐疑

議論の波を生み出し、この 2 つのリリースは開発者コミュニティ内の意見を大きく分けました。一部のユーザーは新しいモデルの応答性を称賛しましたが、他のユーザーは重大な問題を報告しました。 発売について議論した Hacker News のスレッドは、この二極化した感情を完璧に捉えていました。

一方で、早期採用者は新しいモデルのパフォーマンスを賞賛しました。あるユーザーは、「Composer はすべてを改善し、Codex が失敗したところでつまずくことはありませんでした。そして最も重要なのは、速度が大きな違いを生みます。非常に使いやすく、おめでとうございます。」

一方で、数人のユーザーは、最初のエクスペリエンスがイライラしたと報告しました。あるコメントでは、「今夜新しいシステムを使用しましたが、明らかなダウングレードのように感じました。動作しない基本アプリがいくつか生成され、NextJS 環境で CSS を処理できませんでした。」

同社の主張に関して、Hacker News などのプラットフォームではすぐに懐疑的な見方が表面化しました。主な批判は透明性の欠如に集中しています。

あるユーザーが指摘したように、「ここでの透明性の欠如はひどい。テスト対象のモデルのスコアを集計しており、パフォーマンスが曖昧になっている。彼らは、公開しない独自の内部ベンチマークの結果のみを公開している。」

この意見に同調して、他のユーザーも、Composer のトレーニング用の未公開の基本モデルを疑問視し、そのアーキテクチャや潜在的なバイアスを独自に評価することが困難になっていると疑問を呈しました。

独自の社内モデルへの移行は、より大きな業界トレンドの一部です。スピードと専門性が重要な差別化要因になりつつあります。

コメントの中で、Cursor ML 研究者は同社の戦略を組み立て、次のように述べています。「生産性を高めるために必要な最小限のインテリジェンスが存在し、それをスピードと組み合わせることができれば素晴らしいということです。」

このような哲学により、Composer は主要な研究所のより強力ではあるが、潜在的に遅いモデルと直接対決することになります。

一部の開発者にとって、ただし、生のインテリジェンスが最優先事項であることに変わりはありません。あるユーザーは、「私は外れ値かもしれないが、Sonnet 4.5 の品質は私が望んでいるのと同じくらい低いです。生成速度が問題でも時間のロスでもない。適切な出力を得るために格闘しているのです。」と述べています。 Cursor の戦略により、Cursor は熾烈な競争市場に置かれています。

GitHub は最近、OpenAI、Anthropic、Google のモデルを 1 つのコントロール プレーンの下に統合する独自のマルチエージェント プラットフォームである Agent HQ を発表しました。

一方、Anthropic のような個々のプロバイダーは、最近リリースされた Web 用の Claude Code など、自社の製品を改良し続けています。

Cursor は、独自のモデルを構築することで、統合された高速エクスペリエンスは、たとえそれが最大のフロンティア モデルの本来のパワーの一部を犠牲にすることを意味するとしても、忠実なユーザー ベースを切り開くことができます。

Categories: IT Info