L’IDE de codage d’IA Cursor a lancé son premier modèle interne, Composer, le 29 octobre. Sa sortie a coïncidé avec une mise à jour majeure de la plateforme, Cursor 2.0.
Donnant la priorité à la vitesse, le nouveau modèle Composer est déclaré par l’entreprise comme étant quatre fois plus rapide que des outils similaires.
Cursor 2.0 introduit une interface repensée pour gérer plusieurs agents d’IA en parallèle. Les développeurs peuvent désormais comparer les résultats de différents modèles sur la même tâche.
Bien que le lancement ait suscité les éloges des premiers utilisateurs pour ses performances, il a également suscité des critiques pour son manque de transparence concernant les origines du modèle et son utilisation de benchmarks de performances privés.
Un besoin de rapidité : présentation du modèle Composer
Dans le but de maintenir les développeurs dans un état de flux, Cursor a positionné Composer comme un modèle frontière conçu pour le codage interactif à faible latence. Cursor le décrit comme un modèle mixte d’experts (MoE). Il était spécialisé dans le génie logiciel par apprentissage par renforcement (RL).
Au cours de sa formation, le modèle a eu accès à des outils tels que la recherche sémantique et a été chargé de résoudre des défis de codage du monde réel. Selon Cursor, le résultat est un modèle qui effectue la plupart des tours agents en moins de 30 secondes. De telles performances le rendraient quatre fois plus rapide que des concurrents tout aussi intelligents.
Cependant, ces affirmations en matière de performances sont basées sur une évaluation interne exclusive appelée « Cursor Bench ». Ce benchmark est constitué de demandes réelles d’agents émanant des propres ingénieurs de l’entreprise. L’absence d’un indice de référence public et reproductible est devenue un point central du débat après le lancement.
Malgré le secret, la société a fait preuve de transparence en matière de prix. Selon sa documentation officielle, le modèle Composer coûte 1,25 $ par million de jetons d’entrée et 10,00 $ par million de jetons de sortie. Il est placé au même prix que GPT-5 et Gemini 2.5 Pro dans l’environnement Cursor, ce qui témoigne de la confiance dans ses capacités.
Jongler avec les agents : une nouvelle interface dans Cursor 2.0
Parallèlement au nouveau modèle, la sortie de Cursor 2.0 marque un changement important dans la conception de l’EDI. Il passe d’un workflow centré sur les fichiers à un workflow centré sur les agents. Son interface mise à jour est conçue pour exécuter de nombreux agents en parallèle sans qu’ils n’interfèrent les uns avec les autres.
Cette architecture multi-agent est alimentée par des arbres de travail git ou des machines distantes. De tels outils créent des environnements isolés dans lesquels chaque agent peut travailler, évitant ainsi les conflits.
Grâce à cette configuration, les développeurs peuvent attribuer simultanément la même tâche complexe à différents modèles, par exemple en demandant à Sonnet 4.5 et à Composer d’implémenter une fonctionnalité.
Les utilisateurs peuvent ensuite comparer les résultats et choisir la meilleure approche. Connu sous le nom de « codage dynamique », le flux de travail gagne du terrain en tant que moyen d’exploiter les atouts distinctifs des différents modèles d’IA. Google a récemment réorganisé son AI Studio avec une philosophie similaire.
La mise à jour comprend également des outils permettant de rationaliser la révision et les tests de code, intégrant davantage l’IA dans le cycle de vie du développement.
Un accueil polarisé : éloges et scepticisme de la communauté
Générant une vague de discussions, le double lancement a fortement divisé les opinions au sein de la communauté des développeurs. Si certains utilisateurs ont loué la réactivité du nouveau modèle, d’autres ont signalé des problèmes importants. Un fil de discussion de Hacker News discutant du lancement a parfaitement capturé ce sentiment polarisé.
D’un côté, les premiers utilisateurs ont loué les performances du nouveau modèle. Un utilisateur a écrit :”Composer a tout fait mieux, n’a pas trébuché là où le Codex a échoué et, plus important encore, la vitesse fait une énorme différence. Il est extrêmement confortable à utiliser, félicitations.”
D’un autre côté, plusieurs utilisateurs ont signalé une première expérience frustrante. L’un d’entre eux a commenté : “J’ai utilisé le nouveau système ce soir et cela ressemblait à un déclassement définitif. J’ai généré quelques applications de base qui ne fonctionnaient pas, je ne pouvais pas gérer les CSS dans un environnement NextJS.”
Le scepticisme a rapidement fait surface sur des plateformes comme Hacker News concernant les affirmations de l’entreprise. Les principales critiques portent sur le manque de transparence.
Comme l’a souligné un utilisateur : “Le manque de transparence ici est sauvage. Ils regroupent les scores des modèles qu’ils testent, ce qui obscurcit les performances. Ils ne publient que des résultats sur leur propre benchmark interne qu’ils ne publieront pas.”
Faisant écho à ce sentiment, d’autres ont remis en question le modèle de base non divulgué pour la formation de Composer, ce qui rend difficile l’évaluation indépendante de son architecture ou de ses biais potentiels.
Une évolution vers des technologies propriétaires, modèles internes, il s’inscrit dans une tendance plus large de l’industrie. La vitesse et la spécialisation deviennent des différenciateurs clés.
Dans un commentaire, un chercheur de Cursor ML a défini la stratégie de l’entreprise en déclarant: « Notre point de vue est qu’il existe désormais une quantité minimale d’intelligence nécessaire pour être productif, et que si vous pouvez l’associer à la vitesse, c’est génial. »
Une telle philosophie oppose Composer directement à des modèles plus puissants mais potentiellement plus lents issus de grands laboratoires.
Pour certains développeurs, cependant, l’intelligence brute reste la priorité. priorité. Comme l’a noté un utilisateur : “Je suis peut-être une exception, mais la qualité de Sonnet 4.5 est à peu près aussi faible que je le souhaite. Ce n’est pas la vitesse de génération qui est le problème ni la perte de temps. Il faut lutter avec elle pour obtenir le bon résultat.”La stratégie de Cursor le place sur un marché extrêmement concurrentiel.
GitHub a récemment dévoilé sa propre plateforme multi-agents, Agent HQ, qui réunit les modèles d’OpenAI, d’Anthropic et de Google sous un seul plan de contrôle.
Pendant ce temps, des fournisseurs individuels comme Anthropic continuent d’affiner leurs offres, comme le récemment lancé Claude Code pour le Web.
En construisant son propre modèle, Cursor parie qu’un Une expérience à haute vitesse et étroitement intégrée peut se tailler une base d’utilisateurs fidèles, même si cela signifie sacrifier une partie de la puissance brute des plus grands modèles pionniers.