发生了什么

一种名为 Spec Coding 的方法论——正式名称为 Spec-Driven Development(SDD,规范驱动开发)——正在中文开发者社区中迅速获得关注。这是针对 Vibe Coding 的一种结构化替代路径。Vibe Coding 作为一种对话式 AI 编程模式,于 2025 年初快速走红。上述内容来自掘金(Juejin)发表的一篇技术分析文章——掘金是中国主要的开发者内容平台之一。

该文章详细记录了 Vibe Coding 在实际使用中暴露的一种典型失效模式:当 AI 编程会话变得复杂时,会出现三个明确的崩溃节点。其一,**起点漂移**:AI 会用"看起来合理但实际错误"的假设填补未明确声明的架构约束。其二,**上下文崩溃**:随着对话长度增加,已确认的接口决策和约束条件会被悄然覆盖。其三,**过程丢失**:整个工程过程中不产生任何可持久保存的工程产物,只留下无法移交或恢复的聊天记录。

Spec Coding 在自然语言需求与代码生成之间插入一份结构化规范文档,作为中间层,将整个开发流程拆分为六个独立阶段:需求描述、AI 驱动的澄清提问、方案生成、任务分解、逐步执行,以及完成检查清单。

为什么重要

Vibe Coding 的崩溃问题并非纸上谈兵。任何在多文件、多会话项目中使用 Cursor、Claude Code 或 Copilot Workspace 的工程团队,都正在这篇文章所描述的失效区间内运作。上下文窗口会被截断;第一个会话中做出的决策,在第四个会话里模型已无从知晓。结果正如作者所言:AI 在每一个新对话线程中都会重置为"职场新人"状态。

Spec Coding 的核心判断是:结构化文档作为持久化机制,比对话历史更加可靠。通过强制要求 AI 在生成代码之前,先将目标、边界、验收标准和约束条件落实为书面内容,规范文档便成为一份稳定的参考基准,能够在上下文窗口限制和会话重置中保持完整。这与现有软件工程产物之间存在直接的映射关系:规范文档的目标部分对应需求条目,边界部分对应设计决策日志,验收部分对应测试计划,约束部分则对应质量门禁定义。

这一方法论同样是 AI 编程工具演进方向的一个信号。早期 Vibe Coding 浪潮的优化目标是零摩擦启动与快速原型验证;而正在兴起的 Spec Coding 浪潮,优化目标转向了正确性、可审计性与团队交接能力——这些特性在 AI 生成代码进入生产系统(而非停留在演示阶段)时,才真正举足轻重。

技术细节

文章援引了两类被视为 Spec Coding 实现方案的工具。

IDE 集成方案

百度的 Comate IDE 与字节跳动的 Trae 被指出已将 Spec Mode 直接内置于产品界面,用户无需借助外部工具即可切换模式。这两款产品主要面向中国市场。

开源工具链

文章重点介绍了两款面向国际主流编辑器的开源工具:

  • spec-kit —— 一款发布于 GitHub 的开源规范驱动开发工具套件。通过 specify init 完成初始化后,它向 Cursor 等 AI 编程工具暴露四条核心指令:/speckit.specify(将需求转换为规范文档)、/speckit.plan(生成技术实现方案)、/speckit.tasks(将方案分解为可执行任务列表),以及 /speckit.implement(逐步执行任务)。
  • OpenSpec —— 文章提及的另一款开源工具,同样以 Cursor 和 Claude Code 集成为目标,属于同一类别的替代选项。

最小可用规范

文章定义了一份规范文档在实际工程中具备可操作性所需的四个必要组成部分:

  • 目标(Goal):正在解决的业务问题,以及可量化的成功标准
  • 边界(Boundary):范围内与范围外的事项、异常路径、依赖关系与前置条件
  • 验收(Acceptance):可执行、可度量、可用于回归测试的验收条目
  • 约束(Constraints):性能、安全、审计、兼容性、成本与时效等方面的要求

该框架明确指出,规范文档的完整程度与下游的返工量及分歧数量成反比——这是一个可验证的工程命题,尽管原文并未提供基准测试数据。

值得关注的动向

对于正在评估这一方法论的工程团队,以下几个方向在未来 30 天内值得持续追踪:

  • spec-kit 的采用速度:关注其 GitHub 仓库的 Star 增长与贡献者活跃度。一旦西方市场的 Cursor 和 Claude Code 用户开始集成该工具,将意味着这一方法论正在从中文开发者社区扩散至主流 AI 编程工具链。
  • Cursor 与 Claude Code 的原生规范功能:两款工具均处于活跃开发阶段,任何一方都有可能推出内置的规范或规划模式,从而使第三方工具失去必要性。尤其是 Anthropic 的 Claude Code,其 Agentic 能力正在快速扩展。
  • OpenSpec 的差异化定位:文章将 OpenSpec 与 spec-kit 并列提及,但未详述两者的区别。若两个项目的维护者能够做出澄清,将有助于判断它们究竟是竞争关系还是互补工具。
  • 企业级 IDE 的采用情况:若百度 Comate Spec Mode 的使用数据公开,将提供首批生产环境数据,用以验证结构化规范是否能够在大型代码库中降低 AI 编程的错误率——这正是 SDD 论点中目前尚未得到验证的核心主张。