AI-koodaus IDE Cursor julkaisi ensimmäisen talon sisäisen mallinsa, Composerin, 29. lokakuuta. Sen julkaisu tapahtui samaan aikaan suuren alustapäivityksen, Cursor 2.0:n kanssa.
Yritys väittää uuden Composer-mallin olevan neljä kertaa nopeampi kuin vastaavat työkalut.
Cursor 2.0-agentti esittelee hallittavan agenttikäyttöliittymän. Kehittäjät voivat nyt vertailla eri mallien tuotoksia samassa tehtävässä.
Vaikka julkaisu on kerännyt varhaisilta käyttäjiltä kiitosta suorituskyvystään ja mallin käytön puutteesta, se on myös herättänyt kritiikkiä mallin tehokkuudesta. vertailuarvot.
Need for Speed: Esittelyssä Composer-malli
Cursorin tavoitteena on pitää kehittäjät virtaustilassa, ja se on asettanut Composerin rajamalliksi, joka on rakennettu matalan viiveen ja interaktiivisen yhteiskäytön. Kursori kuvaa sitä asiantuntijoiden yhdistelmämallina (MoE). Se oli erikoistunut ohjelmistosuunnitteluun vahvistusoppimisen (RL) avulla.
Koulutuksen aikana mallille annettiin pääsy työkaluihin, kuten semanttiseen hakuun, ja sen tehtävänä oli ratkaista todellisia koodaushaasteita. Cursorin mukaan tuloksena on malli, joka suorittaa useimmat agenttikäännökset alle 30 sekunnissa. Tällainen suorituskyky tekisi siitä neljä kertaa nopeamman kuin vastaavan älykkäät kilpailijat.
Nämä suorituskykyvaatimukset perustuvat kuitenkin omaan sisäiseen arviointiin nimeltä”Cursor Bench”. Tämä vertailuarvo koostuu todellisista agenttipyynnöistä yrityksen omien insinöörien taholta. Julkisen, toistettavan vertailuarvon puuttumisesta on tullut keskeinen keskustelunaihe lanseerauksen jälkeen.
Salaisuudesta huolimatta yritys on ollut avoin hinnoittelussa. Virallisen dokumentaation mukaan Composer-malli maksaa 1,25 dollaria miljoonalta syöttötunnisteelta ja 10,00 dollaria miljoonalta tulostetunnisteelta. Se on samassa hintapisteessä kuin GPT-5 ja Gemini 2.5 Pro Cursor-ympäristössä, mikä osoittaa luottamusta sen kykyihin.
Jongling Agents: Cursor 2.0:n uusi käyttöliittymä
Uuden mallin ohella Cursor 2.0:n julkaisu merkitsee merkittävää muutosta IDE:n suunnittelussa. Se siirtyy tiedostokeskeisestä agenttikeskeiseen työnkulkuun. Sen päivitetty käyttöliittymä on rakennettu ajamaan monia agentteja rinnakkain ilman, että ne häiritsevät toisiaan.
Tätä moniagenttiarkkitehtuuria tukevat git-työpuut tai etäkoneet. Tällaiset työkalut luovat erillisiä ympäristöjä kullekin agentille työskennelläkseen ja estävät ristiriitoja.
Tämän asennuksen avulla kehittäjät voivat määrittää saman monimutkaisen tehtävän eri malleille samanaikaisesti – esimerkiksi pyytää sekä Sonnet 4.5:tä että Composeria ottamaan käyttöön ominaisuuden.
Käyttäjät voivat sitten vertailla tuloksia ja valita parhaan lähestymistavan.”Vibe-koodauksena”tunnettu työnkulku on saamassa vetovoimaa keinona hyödyntää eri tekoälymallien vahvuuksia. Google uudisti äskettäin tekoälystudioaan samankaltaisella filosofialla.
Päivitykseen sisältyy myös työkaluja, jotka virtaviivaistavat koodin tarkistusta ja testausta ja integroivat tekoälyä entisestään kehityksen elinkaareen.
Polarisoitunut vastaanotto: yhteisön ylistystä ja skeptisyyttä
Kehittäjäyhteisö on jakanut jyrkän keskustelun aallon. Vaikka jotkut käyttäjät ylistivät uuden mallin reagointikykyä, toiset ilmoittivat merkittävistä ongelmista. Julkaisua käsittelevä Hacker News-ketju vangitsi tämän polarisoidun tunteen täydellisesti.
Yhtäältä varhaiset käyttöönottajat ylistivät uuden mallin suorituskykyä. Yksi käyttäjä kirjoitti:”Säveltäjä teki kaiken paremmin, ei kompastunut Codexin epäonnistumiseen, ja mikä tärkeintä, nopeudella on valtava ero. Se on erittäin mukava käyttää, onnittelut.”
Toisaalta useat käyttäjät ilmoittivat turhauttavasta alkukokemuksesta. Yksi kommentoi:”Käytin uutta järjestelmää tänä iltana ja se tuntui selvältä alenemiselta. Luoti muutamia toimimattomia perussovelluksia, en voinut käsitellä CSS:ää NextJS-ympäristössä.”
Skepsis nousi nopeasti Hacker Newsin kaltaisilla alustoilla yrityksen väitteisiin liittyen. Ensisijainen kritiikki kohdistuu läpinäkyvyyden puutteeseen.
Kuten eräs käyttäjä huomautti:”Läpinäkyvyyden puute täällä on villiä. He yhdistävät testaamiensa mallien pisteet, mikä hämärtää suorituskykyä. He julkaisevat vain omia sisäisiä vertailuarvojaan koskevia tuloksia, joita he eivät julkaise.”
Toistaen tämän mallin koulutuksen, ja muut kyseenalaistivat sitä, ja muut kyseenalaistavat sen. sen arkkitehtuuria tai mahdollisia harhoja on vaikea arvioida itsenäisesti.
Siirry kohti omia, sisäisiä malleja, se on osa laajempaa alan trendiä. Nopeudesta ja erikoistumisesta on tulossa keskeisiä erottavia tekijöitä.
Kommentissa Cursor ML-tutkija kehysti yrityksen strategiaa ja totesi:”Näkemyksemme on, että nyt on olemassa pieni määrä älykkyyttä, joka tarvitaan tuottamiseen, ja jos voit yhdistää sen nopeuden kanssa, se on mahtavaa.”
Tällainen voimakas malli, mutta potentiaalisempi filosofia. labs.
Joillekin kehittäjille raaka älykkyys on kuitenkin edelleen tärkein prioriteetti. Kuten eräs käyttäjä totesi:”Ehkä olen poikkeava, mutta Sonnet 4.5-laatu on suunnilleen niin alhainen kuin olen valmis menemään. Sukupolven nopeus ei ole ongelma tai ajan nielu. Se kamppailee sen kanssa saadakseen oikean tuloksen.”Cursorin strategia asettaa sen ankaralle kilpailulle.
GitHub julkisti äskettäin oman usean agentin alustansa, Agent HQ:n, joka yhdistää OpenAI:n, Anthropicin ja Googlen mallit yhden ohjaustason alle.
Sillä välin yksittäiset palveluntarjoajat, kuten Anthropic, jatkavat tarjontansa hiomista, kuten äskettäin julkaistua Claudype-verkkomallia
. Cursor vetoaa siihen, että tiiviisti integroitu, nopea käyttökokemus voi luoda uskollisen käyttäjäkunnan, vaikka se tarkoittaisi osan suurimpien huippumallien raakatehosta uhraamista.