L’IDE di codifica AI Cursor ha lanciato il suo primo modello interno, Composer, il 29 ottobre. Il suo rilascio ha coinciso con un importante aggiornamento della piattaforma, Cursor 2.0.

Dando priorità alla velocità, l’azienda afferma che il nuovo modello Composer è quattro volte più veloce di strumenti simili.

Cursor 2.0 introduce un’interfaccia riprogettata per la gestione di più agenti AI in parallelo. Gli sviluppatori possono ora confrontare gli output di diversi modelli nella stessa attività.

Sebbene il lancio abbia ricevuto elogi dai primi utenti per le sue prestazioni, ha anche suscitato critiche per la sua mancanza di trasparenza riguardo alle origini del modello e al suo utilizzo di benchmark privati delle prestazioni.

Bisogno di velocità: introduzione al modello Composer

Con l’obiettivo di mantenere gli sviluppatori in uno stato di flusso, Cursor ha posizionato Composer come modello di frontiera creato per la codifica interattiva a bassa latenza. Il cursore lo descrive come un modello misto di esperti (MoE). Era specializzato nell’ingegneria del software attraverso l’apprendimento per rinforzo (RL).

Durante la formazione, il modello ha avuto accesso a strumenti come la ricerca semantica e ha avuto il compito di risolvere le sfide di codifica del mondo reale. Secondo Cursor, il risultato è un modello che completa la maggior parte dei turni degli agenti in meno di 30 secondi. Tali prestazioni lo renderebbero quattro volte più veloce rispetto a concorrenti altrettanto intelligenti.

Tuttavia, queste dichiarazioni sulle prestazioni si basano su una valutazione interna proprietaria chiamata”Cursor Bench”. Questo benchmark è costituito da richieste di agenti reali da parte degli ingegneri dell’azienda. La mancanza di un benchmark pubblico e replicabile è diventata un punto centrale del dibattito dopo il lancio.

Nonostante la segretezza, l’azienda è stata trasparente riguardo ai prezzi. Secondo la documentazione ufficiale, il modello Composer costa $ 1,25 per milione di token di input e $ 10,00 per milione di token di output. Si colloca allo stesso prezzo di GPT-5 e Gemini 2.5 Pro all’interno dell’ambiente Cursor, segnalando fiducia nelle sue capacità.

Agenti di giocoleria: una nuova interfaccia in Cursor 2.0

Oltre al nuovo modello, il rilascio di Cursor 2.0 segna un cambiamento significativo nel design dell’IDE. Si passa da un flusso di lavoro incentrato sui file a uno incentrato sugli agenti. La sua interfaccia aggiornata è progettata per eseguire molti agenti in parallelo senza che interferiscano tra loro.

Alla base di questa architettura multi-agente ci sono alberi di lavoro git o macchine remote. Tali strumenti creano ambienti isolati in cui ciascun agente può lavorare, prevenendo conflitti.

Utilizzando questa configurazione, gli sviluppatori possono assegnare la stessa attività complessa a diversi modelli contemporaneamente, ad esempio chiedendo sia a Sonnet 4.5 che a Composer di implementare una funzionalità.

Gli utenti possono quindi confrontare i risultati e scegliere l’approccio migliore. Conosciuto come”vibe coding”, il flusso di lavoro sta guadagnando terreno come un modo per sfruttare i punti di forza distinti di vari modelli di intelligenza artificiale. Google ha recentemente rinnovato il suo AI Studio con una filosofia simile.

Nell’aggiornamento sono inclusi anche strumenti per semplificare la revisione e il test del codice, integrando ulteriormente l’intelligenza artificiale nel ciclo di vita dello sviluppo.

Un’accoglienza polarizzata: elogi e scetticismo della comunità

Generando un’ondata di discussioni, il doppio lancio ha diviso nettamente le opinioni all’interno della comunità degli sviluppatori. Mentre alcuni utenti hanno lodato la reattività del nuovo modello, altri hanno segnalato problemi significativi. Un thread di Hacker News in cui si parlava del lancio ha catturato perfettamente questo sentimento polarizzato.

Da un lato, i primi utilizzatori hanno elogiato le prestazioni del nuovo modello. Un utente ha scritto:”Composer ha fatto tutto meglio, non ha inciampato dove Codex ha fallito e, cosa più importante, la velocità fa un’enorme differenza. È estremamente comodo da usare, congratulazioni.”

D’altra parte, diversi utenti hanno segnalato un’esperienza iniziale frustrante. Uno ha commentato:”Stasera ho usato il nuovo sistema e mi è sembrato un downgrade definitivo. Ho generato alcune app di base non funzionanti, non potevo gestire CSS in un ambiente NextJS.”

Lo scetticismo è emerso rapidamente su piattaforme come Hacker News riguardo alle affermazioni dell’azienda. La critica principale è incentrata sulla mancanza di trasparenza.

Come ha sottolineato un utente,”La mancanza di trasparenza qui è estrema. Aggregano i punteggi dei modelli rispetto ai quali testano, il che oscura le prestazioni. Rilasciano solo risultati sul proprio benchmark interno che non rilasciano.”

Facendo eco a questo sentimento, altri hanno messo in dubbio il modello base non divulgato per la formazione di Composer, rendendo difficile valutare in modo indipendente la sua architettura o potenziali pregiudizi.

Il passaggio a modelli proprietari e interni fa parte di una tendenza del settore più ampia. Velocità e specializzazione stanno diventando fattori chiave di differenziazione.

In un commento, un ricercatore di Cursor ML ha delineato la strategia dell’azienda, affermando:”La nostra opinione è che ora sia necessaria una quantità minima di intelligenza per essere produttivi e che se si riesce ad abbinarla alla velocità è fantastico.”

Tale filosofia contrappone Composer direttamente a modelli più potenti ma potenzialmente più lenti dei principali laboratori.

Per alcuni sviluppatori, tuttavia, l’intelligenza pura rimane la massima priorità. Come ha notato un utente,”Forse sono un valore anomalo, ma la qualità di Sonnet 4.5 è tanto bassa quanto sono disposto a raggiungere. La velocità di generazione non è il problema o la perdita di tempo. Si tratta di lottare con essa per ottenere l’output giusto.”La strategia di Cursor lo colloca in un mercato fortemente competitivo.

GitHub ha recentemente presentato la propria piattaforma multi-agente, Agent HQ, che unisce modelli di OpenAI, Anthropic e Google sotto un unico piano di controllo.

Nel frattempo, singoli fornitori come Anthropic continuano a perfezionare le loro offerte, come Claude Code per il web lanciato di recente.

Costruendo il proprio modello, Cursor scommette che un’esperienza strettamente integrata e ad alta velocità può ritagliarsi una base di utenti fedele, anche se ciò significa sacrificare parte della potenza pura dei più grandi modelli di frontiera.

Categories: IT Info