TL;DR
A lényeg: A Mistral AI elindította a Devstral 2-t és a Vibe CLI-t, hogy autonóm”vibe kódolási”képességeket hozzon a nyitott súlyú modellekbe. Főbb jellemzők: A 123B modell hétszer jobb költséghatékonyságot állít be, mint a Claude Sonnet, míg egy kisebb, 24B-s verzió helyileg fut fogyasztói hardveren. Miért számít: Ez kihívás elé állítja az olyan védett ökoszisztémákat, mint a Replit, mivel a magánélet-tudatos vállalatok hatékony, saját üzemeltetésű alternatívát kínálnak az ügynöki szoftverfejlesztéshez. Kontextus: A kiadás ellensúlyozza az OpenAI és a Google közelmúltbeli lépéseit, és a Mistral az amerikai óriások elsődleges nyíltsúlyú riválisa.
A Mistral AI kedden elindította a Devstral 2-t, megkérdőjelezve a szabadalmaztatott kódolási asszisztensek dominanciáját. Az új, 123 milliárdos paraméteres modell a feltörekvő „vibe kódolási” piacot célozza meg, és önálló szoftverfejlesztési képességeket kínál, amelyek vetekednek a zárt rendszerekkel, miközben közel 85%-kal csökkentik azok költségeit.
A kiadás tartalmazza a következőt is: ttM. Vibe, egy parancssori interfész (CLI), amelyet arra terveztek, hogy a fejlesztők természetes nyelven keresztül hajtsanak végre összetett refaktorálási feladatokat. A csomagot a Devstral Small 2 teszi teljessé, egy 24 milliárdos paraméteres változat, amelyet fogyasztói hardvereken történő helyi telepítésre optimalizáltak.
A kiadás szembeállítja a Google-t és az OpenAI-t, amelyek exkluzív partnerkapcsolatokkal zárják le ökoszisztémáikat, és a Mistralt nyílt súlyú alternatívaként pozicionálják az adatvédelem-tudatos vállalkozások számára.
Promóció
A „Vibe Coding” Pivot: Agents Over Chatbots a mark, a chatbots egyszerű kiadása A Mistral belép a „vibe kódolási” trendbe, ahol a fejlesztők a természetes nyelvi utasításokra hagyatkoznak, hogy teljes funkciókat generáljanak ahelyett, hogy kézi szintaxist írnának.
Míg az olyan eszközök, mint a Cursor és a Replit népszerűsítették ezt a munkafolyamatot a böngészőben, a Mistral közvetlenül a terminálba tolja.
A Mistral Vibe CLI közvetlenül a helyi átmenetként szolgál a helyi környezetbe. A nyílt forráskódú parancssori asszisztensként működő eszköz a Devstral-modellt kihasználva a természetes nyelvi felszólításokat konkrét műveletekké alakítja.
Ahelyett, hogy egyszerűen kivonatokat generálna, a rendszert úgy tervezték, hogy a teljes kódbázison feltárja, módosítsa és végrehajtsa a változtatásokat.
Ez akár önálló terminál-segédprogramként, akár IDE-n belül működik az Agent Communication Protocol-on keresztül. Az interfész aktív eszközöket kínál, amelyek lehetővé teszik az ügynök számára a fájlok kezelését, a kódban való keresést, a verzióvezérlés kezelését és a shell-parancsok autonóm végrehajtását.
A fájlstruktúrák és a Git állapot vizsgálatával a CLI olyan „projekt-tudatos” kontextust hoz létre, amely a hagyományos automatikus kiegészítési eszközökből hiányzik.
Képes kezelni a többfájlos újratelepítést vagy a kódrendszerezést. függőségek egy teljes projektben, anélkül, hogy elveszítenék a tágabb rendszerlogikát.
Benchmark valóság: Hatékonyság kontra nyers teljesítmény
E stratégiai irányvonal alapja a működési hatékonyságra összpontosít, nem pedig a nyers benchmark felsőbbrendűségre. és a memória mélysége.
A Devstral 2 zászlóshajó verziója 123 milliárdos paramétersűrű transzformátorstruktúrát használ, amelyhez egy 256 000 tokenből álló környezeti ablak párosul.
72,2%-os eredményt ad az SWE-bench Verified benchmarkon, ami az eredményt a Mistral bizonyítja, hogy a legkiválóbb, nyitott súlyú modell, amely továbbra is hatékonyan működik.
Egyidejűleg a kisebb Devstral Small 2 változat jelentős kapacitást mutat a lábnyomához képest. Ugyanezen a mércén 68,0%-ot ér el, és állítólag a méreténél ötször nagyobb modellekkel versenyez.
Létfontosságú, hogy ezt a teljesítményt olyan kereteken belül biztosítják, amelyek elég hatékonyak ahhoz, hogy helyi szinten működjön szabványos fogyasztói hardvereken, megkerülve a dedikált adatközponti infrastruktúra szükségességét.
Míg a modell 72,2%-os pontszáma az SWE-bench Verified rendszeren versenyképes (bár a független érvényesítés még függőben van), technikailag a kínai nyílt súlyú modellt követi. href=”https://recodchinaai.substack.com/p/deepseek-v32-make-scaling-laws-keep”target=”_blank”>DeepSeek V3.2.
A DeepSeek jelenleg 73,1%-on tartja a nyílt forráskódú plafont, de a valódi előnyben a Mistral a költség-
.
Az új API ára 0,40 USD millió bemeneti tokenenként és 2,00 USD millió kimeneti tokenenként. Ez a szerkezet jelentősen alákíméli az Anthropic Claude Opus 4.5-ét, és állítólagosan hétszeres költséghatékonysági előnyt kínál a Claude 3.5 Sonnet alapvonalhoz képest.
A hardverkövetelményei a modell vállalati fókuszát tükrözik. A teljes 123B-s paramétermodell futtatásához legalább négy H100-as GPU-ra van szükség, ami szilárdan az adatközponti rétegben helyezkedik el. A nagy infrastrukturális igények ellenére a korai alkalmazók erős átviteli mutatóról számoltak be.
A helyi előny: Devstral Small 2
Az intelligencia és a felhő szétválasztásával a Mistral a piac adatvédelmi érzékeny szegmensét is megcélozza. A Devstral Small 2, egy 24 milliárdos paraméterű változat, kifejezetten fogyasztói hardvereken való futtatásra lett tervezve.
68,0%-os SWE-bench-pontszámmal a kisebb modell súlycsoportja fölé emelkedik, így a sokkal nagyobb, előző generációs modellekhez hasonló teljesítményt nyújt. Elsődleges megkülönböztető tényezője azonban a licencelés.
Míg a nagyobb Devstral 2 módosított MIT-licenc alá tartozik (valószínűleg bevételalapú korlátozásokkal), a Devstral Small 2 a megengedő Apache 2.0 licencet használja. Ez a megkülönböztetés lehetővé teszi a fejlesztők számára, hogy módosítsák és integrálják a modellt a gyakran a tulajdonolt súlyokkal járó jogi megterhelések nélkül.
Vállalkozások számára ez hibrid munkafolyamatot tesz lehetővé: a nehéz 123B modellt az API-n keresztüli összetett építészeti tervezéshez használják, miközben a 24B modellt helyileg telepítik a gyors, privát kódkiegészítés érdekében, amely soha nem hagyja el a vállalati tűzfalat. A „Code Red” fegyverkezési verseny
A mesterséges intelligencia kódolási szektorában zajló intenzív tevékenység időszakához érkezett a bevezetés a közelmúltbeli AI-kiadási rohanás közepette.
A versenytársak vertikális integrációra törekszenek, hogy bezárják a fejlesztőket. A Google Cloud és a Replit együttműködése jól példázza ezt a zárt forráskódú stratégiát, amely egyetlen szabadalmaztatott kötegbe egyesíti az IDE-t, a számítási felhőt és a modellt. Hasonlóképpen, a Gemini 3 Pro és az új Antigravity IDE célja, hogy a felhasználókat a Google ökoszisztémáján belül tartsa.
Az infrastruktúra tulajdonlása szintén kulcsfontosságú csatatérré vált. A Bun felvásárlását követően az Anthropic egy dedikált futtatókörnyezetet épít ki ügynökei végrehajtásának optimalizálására, tovább növelve az önálló modellszolgáltatók belépési korlátait.
A Mistral megközelítése egy külön alternatívát kínál: „Európa bajnokaként” pozicionálja magát, amely rugalmasságot biztosít a nyílt súlyok és a helyi beépítés révén, az USA-alapú falak éles ellentétével. riválisok.