ai-spec 是一个 AI 驱动的开发流水线 —— 从一句话需求到经过完整 review、 测试覆盖、spec 对齐的可审计代码,只要几分钟。
每一个 AI codegen 工具都撞到同样的结构性问题。ai-spec 是针对这些问题设计的。
一条全自动 10 步流水线,从一句话需求到经过 review、打过分、可审计的代码。
扫描路由、schema、依赖、中间件和项目宪法。每一个 prompt 都基于你真实的 codebase —— 不是泛用模板。
生成人可读的 Markdown spec,并拆成有序任务:data → service → api → view → route → test。一次 AI 调用,完整输出。
AI 精炼 spec 并显示彩色 diff。你可以批准、拒绝或要求修改。支持多轮 —— 你不点同意,没有任何代码会被写出来。
从 spec 中抽取 SpecDSL JSON —— 模型、endpoint、behaviors。经结构化校验。是 codegen / 测试 / 导出的单一事实来源。
按依赖顺序逐文件生成。每个完成文件的 export 都会被缓存并注入到后续 prompt —— 消除跨任务幻觉。
跑 npm test / lint / tsc,按文件分组解析错误,带着 DSL 上下文丢给 AI 做精准修复。依赖排序的修复顺序最大化每轮的效率。
Pass 1:架构 + spec 合规。Pass 2:实现正确性 + 边界条件。Pass 3:爆炸半径、复杂度评分、breaking change 风险。
4 维评分:compliance (30%) + DSL coverage (25%) + compile (20%) + review (25%)。和 prompt hash 绑定 —— 跨 run 跟踪质量趋势,零额外 AI 调用。
每一个特性都对应 AI 辅助开发里的一个真实痛点。
自演化的知识库(§1–§9),自动注入到每个 prompt。init 时扫描路由、中间件、schema 和约定。每次 review 后通过 §9 累积 lesson,越来越聪明。
ai-spec init人可读的 Markdown Spec 给工程师 review 和对齐用。机器可读的 SpecDSL JSON 给工具消费。两份都有版本、都可审计。codegen / 测试 / 导出共享同一份契约。
Spec + DSLDSL Gap Loop:在 codegen 前检测稀疏契约,触发针对性的 spec 补全。Review→DSL Loop:结构性的 review 问题反馈到契约里 —— 下次 run 起点更干净。
自纠错第一次 run 时录下真实的 AI 响应。后续 run 确定性重放 —— 零 API 调用、零成本。迭代流水线逻辑和 UI 不烧 token。
ai-spec create --vcr-record人审发生在正确的时机:spec 已清晰、DSL 已通过验证,但还没有任何代码被写出来。abort = 零磁盘残留。继续 = 每一步都有经过验证的契约可循。
[Gate] checkpoint每一次成功的 import 修复都会追加到 ledger。下一次 codegen 时,"DO NOT REPEAT" 段落自动注入到 prompt —— 让同样的幻觉不会重复出现。
v0.54+ 零成本学习每个 run 都有唯一的 RunId。在任何文件被写之前,原始内容都会被快照。一条命令把整个 repo 恢复到 run 之前的状态 —— 精确到文件、精确到 run。
ai-spec restore <runId>Gemini、Claude、OpenAI、DeepSeek、Qwen、GLM、MiniMax、Doubao、MiMo。分步骤混搭:spec 生成用一个模型,codegen 用另一个。支持 per-run provider 覆盖。
--provider --codegen-provider唯一一条把你的后端和前端自动串起来的流水线。
前端 codegen 完成后,跨栈 verifier 会扫描前端代码里的每一个 API 调用,对照后端 DSL 进行校验。phantom 路由(幻觉出来的 endpoint)、HTTP method 不匹配、字符串拼接的路径,都会在你 push 之前被检出并报告。
SpecDSL 不只为 codegen 服务 —— 它驱动你完整的开发工作流。
DSL → 生产可用的 YAML / JSON。直接接入 Postman、Swagger UI 或任意 SDK 生成器。
DSL → Express mock server + MSW handlers + Vite 代理配置。前端开发不用等后端。
DSL → 类型化 interface、请求/响应类型、API endpoint 常量。前后端共享。
生成静态 HTML 质量看板。跨所有 run 跟踪 harness 分数、合规率和评审趋势。
每一步都可见,每一个决策都可审计。 没有黑盒 —— 你能看到正在发生什么、 哪一项打了多少分、哪一处被自动修复了。
[1/10] Loading project context... Constitution : ✔ found (§1–§9) Tech stack : vue · vite · pinia [2/10] Generating spec with glm/glm-4.5... ✔ Spec generated ✔ 8 tasks [3.4/10] Spec quality assessment... Coverage [██████████████████░░] 9/10 Clarity [████████████████░░░░] 8/10 [Gate] Approval Gate — awaiting decision ✔ Approved — continuing... [DSL] Extracting structured contract... ✔ DSL valid — Models: 3 Endpoints: 7 [6/10] Code generation (8 files)... ✔ service · src/api/task.ts ✔ api · src/stores/taskStore.ts ✔ view · src/views/TaskList.vue ████████████████████ 100% [8/10] ⚠ 3 errors — auto-fixing cycle 1... ✔ All errors resolved in 1 cycle [9/10] 3-pass code review... Pass 1 ✔ Architecture aligned Pass 2 ✔ Implementation correct Score [████████████████░░░░] 8.2/10 [10/10] Harness Self-Evaluation... Total [██████████████████░░] 92/100 ✔ 2 lessons → constitution §9 RunId: 20260409-143022-a7f2
ai-spec 把代码生成质量变成数据 —— 可比较、可追踪、可在时间里改进。
跨所有 run 跟踪质量。看你的流水线在变好还是在变差。
每个阶段都计时并记录到 .ai-spec-logs/<runId>.json。
harness 分数是确定性的 —— 生成完成后不再调用 AI。
对结果不满意?一条命令把所有被改过的文件恢复到 run 之前的状态。
任意组合 provider。spec 生成用一个推理强的模型,codegen 换一个快的。