更新:2026-01-19 05:31:05
法国人工智能初创企业Mistral AI推出了全新的Devstral 2模型,以此涉足氛围编码领域,该模型是专门针对高级编码任务设计的。
今天发布的Devstral 2是一款参数达1230亿的模型,配备了自主软件工程能力,公司称其可与顶级专有vie编码系统媲美,同时成本降低近85%。
Devstral 2 会和 Mistral Vibe 一同推出,Mistral Vibe 是全新的命令行界面,能让开发者调用模型,借助自然语言提示来完成复杂任务。另外还有个更轻量的模型 Devstral Small 2,参数只有 240 亿个,是专门为本地部署优化过的。
Mistral AI 正试图为 Google LLC 和 OpenAI 等公司提供的专有编码机器人提供替代方案,这些机器人试图将用户锁定在生态系统中,从而定位自己为真正的开源氛围编码平台。
Mistral Vibe CLI 是核心交互入口,依托底层 Devstral 模型,可将用户的自然语言指令转化为实际的代码修改。该系统功能完备,并非仅生成零散代码片段,而是致力于在整个代码库范围内进行探索、调整与新建操作。它既支持在各类第三方集成开发环境中使用,也能作为独立终端工具运行,同时配备了一系列工具,让模型能够自主完成文件编辑、代码库搜索、版本控制管理以及 shell 命令执行等操作。
Mistral AI 表示,Devstral 2 能够扫描文件结构和 Git 状态,这意味着它拥有“项目感知上下文”,可以在整个项目中更新依赖或修改代码库,而不会丢失对当前作的跟踪。
Mistral AI指出,Devstral 2的核心追求是运行效率。该模型融合了1230亿参数的密集变换器架构与256,000令牌的上下文窗口,在SWE-bench基准测试中斩获72.2%的亮眼成绩,成功跻身行业顶尖编码模型阵营。在同类型无重模型的比拼中,仅有DeepSeek V3.2的得分略胜一筹;此外,谷歌、OpenAI以及Anthropic PBC的前沿模型排名也更为靠前。
Devstral Small 2 版本虽体积小巧却表现出色,在同一项基准测试里获得68%的评分,这表明它足以和体积达其五倍的车型一较高下。这一点相当令人赞叹,由于该型号具备轻量化特性,能够在标准笔记本电脑这类消费级硬件上高效运行,从而避免了云端AI运行时产生的延迟问题。
开配重与成本优势
然而,Mistral AI指出,Devstral 2最突出的优势体现在成本层面:这款模型的应用程序接口定价为每百万输入代币40美分,每百万输出代币2美元。这一价格水平大约是Anthropic旗下Claude Sonnet 3.5等同类模型的七分之一。
Devstral 2与Devstral Small 2最直观的差异在于尺寸大小,不过Mistral AI为这两款模型设定了不同的授权条款。Devstral 2采用的是修改后的MIT许可证,这表明用户需遵守基于收入的特定限制;而Devstral Small 2则使用更为宽松的Apache 2.0许可证,意味着其使用不受限制。正因如此,开发者能够按照自身需求对较小的这款模型进行修改和集成,不必担心专有系统带来的法律问题。
很容易想象,一些使用 Devstral 2 的企业选择混合工作流程,使用重的 1230 亿参数模型处理复杂的架构规划任务,而较小的 240 亿参数版本则用于更快速、私有的代码变更,且这些修改仍属于其网络边界内。
Mistral AI 推出 Devstral 2 之时,编码领域的竞争正愈发激烈,不过其开放权重的策略可能会颇具吸引力。竞争对手们持续在锁定开发者方面发力,谷歌新公布的与 Replit Inc. 的合作便是这种努力的典型体现——把强大的模型、IDE 和云计算整合打包成一个整体方案。
谷歌的Gemini 3 Pro和该公司新推出的AntiGravity IDE实现了紧密集成,这似乎也是为了让开发者能更深入地融入其生态系统;而Anthropic在收购JavaScript工具包Bun后,据说正着手为自家的编码代理开发专用运行时。