Skip to content

AI Plan Mode 的正确用法 — 四步对齐工作流

一行需求 → Plan Mode → 不看计划直接 Build,是大多数人翻车的原因。正确的做法是先跟 AI 多轮对话,把 context 对齐,再让 Plan Mode 生成可携带的 Markdown 计划档。


问题:Plan Mode 被当成了读心术

典型错误操作:

用户:帮我做一个能看所有数据分析的 Dashboard
     → 开 Plan Mode → 不看计划 → 直接 Build

结果:产出与预期差距巨大。

根因:模型手上只有一句话的 context,剩下的全靠猜。假设越多,产出离真实需求越远。

核心观点:

如果你自己都还没想清楚,Plan Mode 再强也救不了你。

AI 的作用是放大你已厘清的想法,而不是凭空替你做出你脑袋中还没成型的工程决策。

常见错误模式对比

模式 操作 结果
❌ 无脑 Plan 一行需求 → Plan → Build 模型盲猜,产出偏差大
❌ 不用 Plan 直接丢需求 Build 无全局规划,架构混乱
✅ 四步对齐 对话 → 确认 → Plan → Build context 充分,一次到位

四步工作流

来源:Ras Mic(Pluto 企业 Agent 平台创作者)

  ┌─────────────────────────────────────────────────┐
  │                四步对齐工作流                      │
  ├─────────────────────────────────────────────────┤
  │                                                 │
  │  ① 强迫对话(不开 Plan Mode)                      │
  │     丟想法、讨论 trade-off、                       │
  │     问"如果这样做会怎样"                            │
  │          │                                      │
  │          ▼                                      │
  │  ② 确认 AI 真的懂了                               │
  │     验证它理解了你的蓝图和决策                      │
  │          │                                      │
  │          ▼                                      │
  │  ③ Plan Mode → 生成 Markdown 计划档               │
  │     存入固定目录(如 .hermes/plans/)              │
  │          │                                      │
  │          ▼                                      │
  │  ④ Build                                        │
  │     用计划档驱动实际编码                            │
  │                                                 │
  └─────────────────────────────────────────────────┘

第一步:强迫对话(核心步骤)

这是整个工作流中最花力气也最值钱的一步。

做什么: - 把想法不断丢给 AI,来回讨论技术取舍 - 问"如果这样做会怎样、那样做又怎样" - 把 trade-off 一个个摊开讨论 - 阻止 AI 提前 Build — 如果模型聊到一半想动手,直接叫停

唯一目标:确保 AI 百分之百理解你脑袋里的蓝图。

第二步:确认理解

验证 AI 真正理解了你的决策和约束条件,而非表面附和。

第三步:生成计划档(关键交付物)

进入 Plan Mode 后,不要直接 Build,而是生成一份独立的 Markdown 计划档。

计划档的价值:

特性 说明
跨分页记忆 多 tab 并行工作时,计划档就是 Agent 的记忆
跨时间存档 搁置两周后回来,计划档告诉你上次做到哪、为什么这样决定
跨工具携带 可丢给 Cursor、Claude Code、Codex 任何工具接手
规格书本质 本质上就是一份个人规格书(Spec-driven Development)

第四步:Build

把 context 完全对齐的计划档丢给 Agent 执行。


实战案例:Expo 还是原生 Swift UI?

Ras Mic 在规划 Pluto 手机 Companion App 时演示了这个流程:

决策问题:跨平台 App 选 Expo 还是原生 Swift UI?

方案 优势 劣势
Expo 一套代码搞定 iOS + Android 需要花力气让 UI 不像网页壳
Swift UI Apple 黄金标准质感 两个平台各写一套,工作量翻倍

通过对话逼出的真实决策: - 没有靠技术品味拍脑袋 - 回头问产品问题:"我的企业客户会不会用 Android?" - 答案: → 选 Expo

Agent 主动发现的性能坑: - 跨平台聊天 App 的消息流渲染是唯一真正的性能瓶颈 - 每条新消息触发整个列表重渲染 → 严重卡顿 - ✅ 解法:列表虚拟化(List Virtualization),只渲染可视区域的消息 - 必须从第一行代码就设计进去,不能事后硬补

如果一键 Build 等到架构写死、画面跑出来才测试发现滑起来卡,拆掉重练的代价极大。


"规划会拖慢出货吗?" — 不会

这个直觉是错的

  ┌──────────────────────────────────┐
  │  模型估算:人类工程师 → 2 周       │
  │  Agent 实际执行 → 2-3 小时        │
  │                                  │
  │  先慢后快的悖论:                   │
  │  投资几分钟对话 → 换取几小时顺畅    │
  └──────────────────────────────────┘

本质:这等于工程界的 Spec-driven Development(规格先行),只是被做成了一套个人 Vibe Coder 就能跑的工作流。


最佳实践清单

应该做的: - 先花 5-10 分钟跟 AI 对话,把需求和约束聊透 - 让 AI 主动提出你可能没想到的问题(如性能、兼容性) - 生成独立的 Markdown 计划档,存入项目目录 - 计划档包含技术选型理由和 trade-off 分析

不要做的: - 一行需求就按 Plan Mode - Plan 跑出来看都不看直接 Build - 让 AI 在对话阶段就开始写代码 - 把计划档当成"过渡期垃圾"忽略

决策树:什么时候需要对话?

  需求复杂度?
     │
     ├─ 低(单文件修改、明确 bug fix)→ 可以直接 Build
     │
     └─ 高(新功能、架构决策、多模块)→ 必须走四步工作流
           │
           ├─ 有技术选型? → 对话讨论 trade-off
           ├─ 有性能要求? → 让 AI 预判瓶颈
           └─ 有多方案?   → 逐个对比后再定案

参考资料与原始来源

相关笔记

  • [[AI Agent 工作流]]
  • [[Spec-driven Development]]
  • [[Prompt Engineering 最佳实践]]