Francouzská společnost Mistral AI rozšířila své portfolio modelů zaměřených na programování. Devstral 2 představuje druhou generaci kódovacího modelu, který dosahuje 72,2 % úspěšnosti v benchmarku SWE-bench Verified a řadí se tak mezi špičkové otevřené modely pro softwarové inženýrství. Současně firma uvolnila Mistral Vibe CLI, terminálového asistenta postaveného na těchto modelech, který umožňuje automatizovat práci s kódem přímo z příkazové řádky.
Devstral 2: kompaktní model s výkonem velkých konkurentů
Devstral 2 je hustý transformerový model se 123 miliardami parametrů a kontextovým oknem 256 tisíc tokenů. Na benchmarku SWE-bench Verified, který testuje schopnost modelů řešit skutečné problémy z repozitářů na GitHubu, dosáhl 72,2 %. Tento benchmark vytvořili výzkumníci z Princetonu ve spolupráci s OpenAI a obsahuje 500 ručně ověřených úloh z reálných Python projektů, kde model musí vygenerovat opravu kódu, která projde jednotkovými testy.
Zajímavější než absolutní číslo je poměr výkonu k velikosti modelu. Devstral 2 je přibližně pětkrát menší než DeepSeek V3 (671 miliard parametrů) a osmkrát menší než čínský Kimi K2 (jeden bilion parametrů). Přesto dosahuje srovnatelných nebo lepších výsledků v úlohách souvisejících s programováním. DeepSeek V3 na SWE-bench Verified v agentickém režimu dosahuje 38,8 %, zatímco Kimi K2 Instruct 65,8 % při jediném pokusu.
Model podporuje práci s celými repozitáři a orchestraci změn napříč více soubory při zachování architektonického kontextu. Sleduje závislosti mezi frameworky, detekuje selhání a opakuje pokusy s korekcemi. Tyto vlastnosti jej předurčují pro úlohy jako opravy chyb nebo modernizace zastaralého kódu.
Mistral uvádí, že Devstral 2 je až sedmkrát nákladově efektivnější než Claude Sonnet při reálných úlohách. V přímém srovnání lidskými hodnotiteli, které provedl nezávislý poskytovatel anotací s využitím prostředí Cline, Devstral 2 překonal DeepSeek R1 s poměrem výher 42,8 % ku 28,6 % proher. Claude Sonnet 4.5 však zůstává preferovanějším modelem, což naznačuje, že mezera vůči uzavřeným modelům stále existuje.
Devstral Small 2: AI asistent pro lokální běh
Menší verze Devstral Small 2 disponuje 24 miliardami parametrů a stejným kontextovým oknem 256 tisíc tokenů. Na SWE-bench Verified dosahuje 68 % a konkuruje modelům až pětkrát větším. Klíčovou vlastností je možnost běhu na spotřebitelském hardwaru včetně jednotlivých grafických karet řady NVIDIA GeForce RTX nebo systémů DGX Spark.
Model podporuje také obrazové vstupy a může pohánět multimodální agenty. Vydání pod licencí Apache 2.0 umožňuje komerční využití bez omezení.
| Model | Parametry | SWE-bench Verified | Licence | Kontextové okno |
|---|---|---|---|---|
| Devstral 2 | 123 mld | 72,2 % | Modifikovaná MIT | 256K tokenů |
| Devstral Small 2 | 24 mld | 68,0 % | Apache 2.0 | 256K tokenů |
| DeepSeek V3 | 671 mld | 38,8 % | MIT | 128K tokenů |
| Kimi K2 Instruct | 1 000 mld | 65,8 % | Apache 2.0 | 128K tokenů |
Mistral Vibe CLI: agentický asistent v terminálu
Mistral Vibe CLI je open source nástroj pro příkazovou řádku, který využívá modely Devstral k automatizaci práce s kódem. Uživatel komunikuje přirozeným jazykem a nástroj provádí změny v souborech, prohledává kód, pracuje s verzovacím systémem a spouští příkazy.
Instalace probíhá jednoduchým příkazem:
curl -LsSf https://mistral.ai/vibe/install.sh | sh
Vibe CLI automaticky skenuje strukturu projektu a stav Git repozitáře pro získání relevantního kontextu. Podporuje reference souborů pomocí znaku @, spouštění shellových příkazů pomocí ! a lomítkové příkazy pro konfiguraci. Nástroj rozumí celému repozitáři, nejen aktuálně editovanému souboru, což umožňuje architektonické uvažování při návrhu změn.
Mezi další vlastnosti patří perzistentní historie, automatické doplňování a přizpůsobitelné barevné motivy. Vibe CLI lze spouštět programaticky pro skriptování, přepínat automatické schvalování akcí nebo konfigurovat lokální modely a poskytovatele pomocí souboru config.toml.
Nástroj je dostupný také jako rozšíření pro editor Zed a podporuje Agent Communication Protocol pro integraci do dalších vývojových prostředí.
Integrace a dostupnost
Mistral navázal partnerství s projekty Kilo Code a Cline, dvěma populárními open source kódovacími agenty pro Visual Studio Code. Kilo Code vznikl jako kombinace funkcí projektů Cline a Roo a nabízí různé režimy práce včetně architekta, kodéra a debuggera. Cline se zaměřuje na transparentnost a kontrolu, kde každá změna vyžaduje explicitní schválení uživatelem.
Devstral 2 je momentálně dostupný zdarma přes Mistral API. Po skončení bezplatného období bude ceník následující:
| Model | Vstupní tokeny | Výstupní tokeny |
|---|---|---|
| Devstral 2 | 0,40 USD/milion | 2,00 USD/milion |
| Devstral Small 2 | 0,10 USD/milion | 0,30 USD/milion |
Pro nasazení na vlastní infrastruktuře Devstral 2 vyžaduje minimálně čtyři GPU třídy H100. Model je dostupný k vyzkoušení na platformě NVIDIA build.nvidia.com. Devstral Small 2 běží na jediné GPU a funguje i v konfiguracích pouze s procesorem bez dedikované grafické karty.
Pro dosažení optimálního výkonu Mistral doporučuje nastavit teplotu na 0,2 a řídit se osvědčenými postupy definovanými v systémovém promptu Vibe CLI.
Kontext vydání
Mistral AI patří mezi nejrychleji rostoucí evropské technologické společnosti. Firma založená v dubnu 2023 třemi bývalými výzkumníky z Google DeepMind a Meta dosáhla v září 2025 valuace 14 miliard USD po investičním kole vedeném nizozemskou společností ASML. Mezi investory patří Andreessen Horowitz, General Catalyst, NVIDIA, Microsoft a Salesforce.
Vydání Devstral 2 přichází v době intenzivní konkurence na poli kódovacích modelů. DeepSeek V3 z Číny dominuje v některých benchmarcích, zatímco Kimi K2 od Moonshot AI představil bilionový model zaměřený na agentické úlohy. Uzavřené modely jako Claude Sonnet 4.5 od Anthropic nebo GPT-4.1 od OpenAI zůstávají v některých srovnáních napřed, ale cenový rozdíl činí otevřené alternativy atraktivními pro mnoho vývojářů a firem.
Mistral pokračuje ve strategii kombinace otevřených modelů s komerčními službami. Devstral 2 s modifikovanou MIT licencí umožňuje úpravy a redistribuci s určitými omezeními pro velké nasazení, zatímco Devstral Small 2 a Vibe CLI pod Apache 2.0 nabízejí plnou svobodu využití.