你不是不會寫 Prompt,是不會定義任務¶
Opus 4.8 跟 GPT-5.5 之后的 Agent,可以在一个指令下连续工作好几个小时,自己读档、改程序、验证。模型升了一整个等级,但多数人的 prompt 跟去年几乎一模一样。真正的瓶颈不在 prompt 技巧,在更上游的"定义任务"能力。
目录¶
- 核心论点:Prompt vs 任务定义
- Prompt 为什么过时了
- 四阶段指令模式
- 五欄位 Brief 框架
- 完成定义的两半
- AI 为何不反问
- 定义任务就是管理能力
- 三支任务交辦 Prompt
- 参考资料
核心论点:Prompt vs 任务定义¶
常见误区 实际瓶颈
───────────── ─────────────
"模型不够强" ──── ✗ ────► "任务本身对 AI 来说是含糊的"
"Prompt 写得不好" ─ ✗ ────► "任务定义不清晰"
写 Prompt = 文笔 定義任務 = 思考
(可以用技巧弥补) (需要真正的结构化思维)
现在拉开差距的是后者。
"写 prompt 可以写得很精致,任务本身对 AI 来说还是含糊的。写 prompt 是文笔,定义任务是思考,这是两种不同的能力。" — Gary Chen
Prompt 为什么过时了¶
模型的进化速度远超用户的 prompt 进化速度:
| 阶段 | 模型能力 | 用户典型做法 |
|---|---|---|
| 2024 | 实习生级别,需要详细指令 | 手把手教,step-by-step |
| 2025 | 初级员工,能完成单步任务 | 开始用框架(如 CRISPE) |
| 2026 | Senior Partner,能连续数小时自主工作 | 还在用去年的 prompt |
关键变化:Agent 时代的模型可以自主读档、改代码、验证、规划下一轮。这类模型需要的不是更精细的 prompt 技巧,而是一份清晰定义的任务 brief。
四阶段指令模式¶
动手前必须经历的四个阶段,阶段错位的任务怎么写都救不回来:
┌──────────┐ ┌──────────┐ ┌──────────┐ ┌──────────┐
│ 1. 思考 │────►│ 2. 探索 │────►│ 3. 決定 │────►│ 4. 執行 │
│ Think │ │ Explore │ │ Decide │ │ Execute │
└──────────┘ └──────────┘ └──────────┘ └──────────┘
| 阶段 | 做什么 | 该下什么样的指令 |
|---|---|---|
| 思考 | 想清楚要什么 | "帮我分析这个问题的维度" |
| 探索 | 了解可选路径 | "列出 3 种可能的做法和各自利弊" |
| 決定 | 选定方向 | "基于以上分析,推荐方案 B,理由是…" |
| 執行 | 交给 AI 干活 | "按照方案 B,产出竞品分析报告" |
典型错误:跳过思考/探索/决定,直接下执行指令 → AI 只能猜你要什么 → 输出看似完整但实际无用。
五欄位 Brief 框架¶
视频的核心交付物。同一个 SaaS 竞品分析任务,从烂 prompt 一路改到完整 brief:
| 欄位 | 英文 | 说明 | 示例 |
|---|---|---|---|
| 目標 | Goal | 你要 AI 产出什么最终交付物 | "一份 3 页的竞品分析报告,覆盖 5 个维度" |
| 背景 | Context | 为什么做这件事,给 AI 决策依据 | "我们在评估是否进入 PMF 阶段,需要了解竞品差异化策略" |
| 素材 | Materials | AI 可以/应该使用的信息源 | "附件是 3 个竞品的官网截图、定价页、G2 评价" |
| 邊界 | Boundaries | 明确不要做什么,避免 AI 自作主张 | "不需要财务数据分析,不要做技术架构对比" |
| 完成定義 | Done Definition | 停在哪 + 什么算好 | 见下方详细拆解 |
从烂 Prompt 到完整 Brief 的对比¶
❌ 烂 Prompt(多数人现状):
"帮我分析一下竞品 XXX 和 YYY 的差异"
✅ 完整 Brief:
目標:产出一份对标 XXX 和 YYY 的竞品分析报告
背景:我们正在 PMF 阶段,需要判断差异化空间
素材:附件含官网截图、定价页、G2 评价
邊界:不做技术架构对比、不做财务分析
完成定義:3 页以内、每个维度有量化评分、最后给一句判断
完成定义的两半¶
"完成定義"是最容易被忽略但最关键的欄位,分两半:
| 半 | 问题 | 说明 |
|---|---|---|
| 停在哪 | AI 做到什么程度该停? | 防止 AI 过度展开或做了一半停下来 |
| 什麼算好 | 什么样的产出算合格? | 把你的 taste 写进 brief,避免拿到"看起来完整但要重做"的版本 |
实践要点: - 停在哪 → 控制产出长度/深度/范围 - 什么算好 → 定义质量标准(格式、精度、风格) - 两半缺一不可,否则 AI 要么做得太多,要么做得不够
AI 为何不反问¶
一个反直觉的事实:模型被设计成立刻行动而非先确认。
| 人类对接 | AI 对接 |
|---|---|
| "这个需求不太清楚,能详细说说吗?" | 直接根据模糊指令开干 |
| "你的意思是要 A 还是 B?" | 自行选择一个方向执行 |
| "做之前我先确认下范围" | 假设范围 = 全部 |
原因:RLHF 训练倾向于"有用"(立即回答),而非"先确认再回答"。这意味着"想清楚"这件事只能由人类来补。
启示:你花在定义任务上的时间,是 AI 替你省不下来的。AI 不会替你想,但它会在你定义好的框架内做得极好。
定义任务就是管理能力¶
同一份 Brief 对人对 AI 都通用——这就是管理力。
| 企业实践 | 对应能力 |
|---|---|
| Amazon 六页 Memo 制度 | 用书面 brief 强制思考,不允许 PPT 模糊表述 |
| Microsoft / LinkedIn Work Trend Index | 数据显示清晰的任务定义对团队产出影响巨大 |
| Brief = 工作指派 | 不管接收方是人还是 AI,要素一样:目标、背景、资源、边界、验收标准 |
管理 Brief AI Brief
────────── ──────────
目標 ←→ 目標
背景 ←→ 背景
資源 ←→ 素材
範圍 ←→ 邊界
驗收標準 ←→ 完成定義
本质:定义任务的能力 = 管理力。AI 时代,这种能力比 prompt 技巧值钱得多。
三支任务交辦 Prompt¶
Gary Chen 提供的三支辅助 Prompt(完整内容在 Patreon):
| Prompt | 用途 | 使用时机 |
|---|---|---|
| Brief Builder | 从零建 Brief | 有模糊想法时,让 AI 帮你结构化 |
| Brief Auditor | 诊断现有 Brief | 写完后送出前,检查是否完整 |
| Stage Decider | 判断当前阶段 | 动手前确认你在哪个阶段 |