9arm-skills — Claude Code 工程纪律技能包¶

一个小型 GitHub 仓库，不是框架、不是 IDE、不是 Claude Code 替代品。它是一组聚焦的行为模板，告诉 Agent 在关键时刻该慢下来——因为好的 Agent 行为不只是给模型更多能力，有时候是告诉它什么时候该克制。

目录¶

核心理念：约束比能力更重要
四大 Shipable Skills
Debug Mantra — 调试四步法
Postmortem — 工程事故记录
Scrutinize — 冷眼审查
Management Talk — 跨频道翻译
四大技能形成完整闭环
在 Verdant 中的落地思路
Agent 的典型失败模式

核心理念：约束比能力更重要¶

大多数人在改善 AI 编码时，方向是「加更多」：

❌ 常见思路                    ✅ 9arm-skills 思路
─────────────────────────────────────────────
更多模型能力                    更好的行为约束
更多工具                        什么时候该停下来
更多上下文                      什么时候该质疑自己
更多命令                        什么时候该拒绝行动

"The highest leverage thing is not more capability. Sometimes, it is better constraints."

四大 Shipable Skills¶

skills/
├── engineering/
│   ├── debug-mantra/       ← 调试纪律
│   ├── postmortem/         ← 事故记录
│   └── scrutinize/         ← 冷眼审查
├── productivity/
│   └── management-talk/    ← 管理层沟通
├── misc/
├── personal/
├── in-progress/
└── deprecated/

Debug Mantra — 调试四步法¶

这是全场最有价值的一个 Skill。

核心规则：在修复之前，必须完成四步。

Step 1                 Step 2
Reproduce              Know the Failing Path
穩定再現問題            追蹤失敗的代碼路徑
    │                      │
    │                      │
    ▼                      ▼
Step 3                 Step 4
Question the           Treat Every Run
Hypothesis             as a Breadcrumb
質疑假設                每次運行都留下線索

对比：无约束 vs 有约束¶

场景	无约束 Agent	有 Debug Mantra
收到错误信息	立刻说 "I found the issue"	先问：能稳定复现吗？
第一轮修改	改 3 个文件	不改，先追失败路径
错误变了	再改 4 个文件	不改，先质疑之前的假设
结果	症状追逐（chase symptoms）	根因修复（fix the root）

关键原则¶

❌ Do NOT:
  - 在有可靠复现之前提出修复方案
  - 在追踪到失败路径之前猜测原因
  - 在尝试证伪之前信任假设

✅ Do:
  - 在正确位置添加摩擦力（friction in the right place）
  - 让 Agent 在修复前变慢，这样修复本身可以更干净

问题的本质：很多 Coding Agent 的毛病不是不会写代码，而是太急于在理解失败之前就写代码。

Postmortem — 工程事故记录¶

写 bug 修复后的工程记录，核心特性：硬门控（hard gates）——缺少必要事实时拒绝撰写。

撰寫前必備條件（缺一不可）：
┌─────────────────────────────────────┐
│  ☐ 可靠的复现步骤（Reliable Repro）  │
│  ☐ 根因已确认（Root Cause Known）    │
│  ☐ 修复方案已识别（Fix Identified）  │
│  ☐ 修复已验证（Fix Validated）       │
│                                     │
│  任何一项缺失 → 拒絕撰寫             │
└─────────────────────────────────────┘

为什么要硬门控？¶

AI 的超能力                              造成的問題
─────────────────────────────────────────────────
能写出看起来很专业的废话                 推测性根因听起来像确定结论
能把猜测包装成 RCA                      把 "可能是" 写成 "确认是"
能把模糊的描述变得有说服力               半年后回看发现全是空话

Postmortem 技能要的不是漂亮文章，是 6 个月后同一个 bug 再次出现时能用的真实记录。

必须包含：文件路径、函数名、测试名、具体验证命令。

Scrutinize — 冷眼审查¶

不是 diff checker，是站在变更之外的审视者。

淺層 Review（常見 AI 行為）          Scrutinize（深度審查）
─────────────────────────────────────────────────
看 diff                              站在变更外部审视
檢查明顯問題                          質疑這個變更是否應該存在
建議加測試                            追問有沒有更簡單的方法
"Looks good overall"                 "What inputs break this?"
                                    "Are the tests testing the real path?"

关键洞察¶

"Coherent does not mean correct."

Agent 很擅长让自己的工作看起来连贯：写计划 → 写代码 → 总结代码使之与计划一致。但这不等于正确。Scrutinize 就是那个「更冷的第二次审视」。

最佳实践：让 Scrutinize 由一个独立的 Agent 执行，而非实现 Agent 自审。实现者有确认偏误（confirmation bias），审查者应该没有。

Management Talk — 跨频道翻译¶

把工程师对工程师的技术内容，翻译给管理层、PM、Release Manager 等受众。

保留                                     剥离
─────────────────────────────────────────────
  ✅ 产品/框架名稱                        ❌ 函數名
  ✅ JIRA ticket ID                      ❌ 堆疊追蹤
  ✅ PR 編號                             ❌ 代碼級細節
  ✅ 影響範圍                            ❌ 內部變數名
  ✅ 負責人                              ❌ 框架內部邏輯
  ✅ 下一步行動

不是 dum things down，是把同样的真相翻译到正确的频道。

四大技能形成完整闭环¶

    ┌──────────┐
    │  Debug   │  正確地調試
    │  Mantra  │
    └────┬─────┘
         │
         ▼
    ┌──────────┐
    │  Post-   │  寫下工程記錄
    │ mortem   │
    └────┬─────┘
         │
         ▼
    ┌──────────┐
    │Scrutinize│  冷眼審查變更
    └────┬─────┘
         │
         ▼
    ┌──────────┐
    │Management│  翻譯給對的人
    │  Talk    │
    └──────────┘

Debug → Review → Record → Communicate
調試  →  審查  →  記錄  →  溝通

这四个技能覆盖了一个严肃 bug 修复的完整生命周期。

在 Verdant 中的落地思路¶

虽然 9arm-skills 是为 Claude Code 设计的，但视频中提出了把它作为 Verdant 工作流蓝图的思路：

9arm-skill	Verdant 落地方式	Agent 角色
Debug Mantra	调试子 Agent（project rule）	只负责复现 → 追踪 → 拒绝提前修复
Scrutinize	独立审查 Agent	在隔离 workspace 中冷眼审查
Postmortem	记录 Agent	拿到真实证据后撰写工程记录
Management Talk	沟通 Agent	把技术记录转为 Jira/Slack 更新

落地关键原则¶

✅ 正確做法                        ❌ 錯誤做法
─────────────────────────────────────────────
每個 Agent 只做一件事              把所有技能塞進每個任務
在正確時機載入正確行為             全局載入所有 skill
Agent 之間隔離                     實現者自審自批
每個產出物有明確職責               調試記錄 = 復盤報告

"Do not dump every skill into every task. Use the right behavior at the right moment."

Agent 的典型失败模式¶

9arm-skills 精准瞄准了 Coding Agent 的四大通病：

失败模式	症状	对应 Skill
修复前不调试	Paste error → Agent 改 3 个文件 → 错误变了 → 改 4 个	Debug Mantra
自我审批太快	写代码 → 自审 → "Looks good" → 提交	Scrutinize
虚假确定性	把猜测写成 RCA，推测性根因包装成确定结论	Postmortem
受众错位	给管理层发堆栈追踪，给工程师发高管摘要	Management Talk

总结¶

核心洞察（一句話）：

Agent performance = Model Intelligence × Workflow Intelligence

模型聰明 ≠ 工作流正確。再強的模型也需要行為約束。

9arm-skills 的价值不在于它有多少行代码或多少个技能，而在于它展示了一个重要原则：让 Agent 在它通常急躁的地方慢下来，在并行工作真正安全的地方并行化。