Skip to content

9arm-skills — Claude Code 工程纪律技能包

一个小型 GitHub 仓库,不是框架、不是 IDE、不是 Claude Code 替代品。它是一组聚焦的行为模板,告诉 Agent 在关键时刻该慢下来——因为好的 Agent 行为不只是给模型更多能力,有时候是告诉它什么时候该克制。


目录


核心理念:约束比能力更重要

大多数人在改善 AI 编码时,方向是「加更多」:

❌ 常见思路                    ✅ 9arm-skills 思路
─────────────────────────────────────────────
更多模型能力                    更好的行为约束
更多工具                        什么时候该停下来
更多上下文                      什么时候该质疑自己
更多命令                        什么时候该拒绝行动

"The highest leverage thing is not more capability. Sometimes, it is better constraints."


四大 Shipable Skills

skills/
├── engineering/
│   ├── debug-mantra/       ← 调试纪律
│   ├── postmortem/         ← 事故记录
│   └── scrutinize/         ← 冷眼审查
├── productivity/
│   └── management-talk/    ← 管理层沟通
├── misc/
├── personal/
├── in-progress/
└── deprecated/

Debug Mantra — 调试四步法

这是全场最有价值的一个 Skill。

核心规则:在修复之前,必须完成四步。

Step 1                 Step 2
Reproduce              Know the Failing Path
穩定再現問題            追蹤失敗的代碼路徑
    │                      │
    │                      │
    ▼                      ▼
Step 3                 Step 4
Question the           Treat Every Run
Hypothesis             as a Breadcrumb
質疑假設                每次運行都留下線索

对比:无约束 vs 有约束

场景 无约束 Agent 有 Debug Mantra
收到错误信息 立刻说 "I found the issue" 先问:能稳定复现吗?
第一轮修改 改 3 个文件 不改,先追失败路径
错误变了 再改 4 个文件 不改,先质疑之前的假设
结果 症状追逐(chase symptoms) 根因修复(fix the root)

关键原则

❌ Do NOT:
  - 在有可靠复现之前提出修复方案
  - 在追踪到失败路径之前猜测原因
  - 在尝试证伪之前信任假设

✅ Do:
  - 在正确位置添加摩擦力(friction in the right place)
  - 让 Agent 在修复前变慢,这样修复本身可以更干净

问题的本质:很多 Coding Agent 的毛病不是不会写代码,而是太急于在理解失败之前就写代码


Postmortem — 工程事故记录

写 bug 修复后的工程记录,核心特性:硬门控(hard gates)——缺少必要事实时拒绝撰写。

撰寫前必備條件(缺一不可):
┌─────────────────────────────────────┐
│  ☐ 可靠的复现步骤(Reliable Repro)  │
│  ☐ 根因已确认(Root Cause Known)    │
│  ☐ 修复方案已识别(Fix Identified)  │
│  ☐ 修复已验证(Fix Validated)       │
│                                     │
│  任何一项缺失 → 拒絕撰寫             │
└─────────────────────────────────────┘

为什么要硬门控?

AI 的超能力                              造成的問題
─────────────────────────────────────────────────
能写出看起来很专业的废话                 推测性根因听起来像确定结论
能把猜测包装成 RCA                      把 "可能是" 写成 "确认是"
能把模糊的描述变得有说服力               半年后回看发现全是空话

Postmortem 技能要的不是漂亮文章,是 6 个月后同一个 bug 再次出现时能用的真实记录。

必须包含:文件路径、函数名、测试名、具体验证命令。


Scrutinize — 冷眼审查

不是 diff checker,是站在变更之外的审视者

淺層 Review(常見 AI 行為)          Scrutinize(深度審查)
─────────────────────────────────────────────────
看 diff                              站在变更外部审视
檢查明顯問題                          質疑這個變更是否應該存在
建議加測試                            追問有沒有更簡單的方法
"Looks good overall"                 "What inputs break this?"
                                    "Are the tests testing the real path?"

关键洞察

"Coherent does not mean correct."

Agent 很擅长让自己的工作看起来连贯:写计划 → 写代码 → 总结代码使之与计划一致。但这不等于正确。Scrutinize 就是那个「更冷的第二次审视」。

最佳实践:让 Scrutinize 由一个独立的 Agent 执行,而非实现 Agent 自审。实现者有确认偏误(confirmation bias),审查者应该没有。


Management Talk — 跨频道翻译

把工程师对工程师的技术内容,翻译给管理层、PM、Release Manager 等受众。

保留                                     剥离
─────────────────────────────────────────────
  ✅ 产品/框架名稱                        ❌ 函數名
  ✅ JIRA ticket ID                      ❌ 堆疊追蹤
  ✅ PR 編號                             ❌ 代碼級細節
  ✅ 影響範圍                            ❌ 內部變數名
  ✅ 負責人                              ❌ 框架內部邏輯
  ✅ 下一步行動

不是 dum things down,是把同样的真相翻译到正确的频道


四大技能形成完整闭环

    ┌──────────┐
    │  Debug   │  正確地調試
    │  Mantra  │
    └────┬─────┘
         │
         ▼
    ┌──────────┐
    │  Post-   │  寫下工程記錄
    │ mortem   │
    └────┬─────┘
         │
         ▼
    ┌──────────┐
    │Scrutinize│  冷眼審查變更
    └────┬─────┘
         │
         ▼
    ┌──────────┐
    │Management│  翻譯給對的人
    │  Talk    │
    └──────────┘

Debug → Review → Record → Communicate
調試  →  審查  →  記錄  →  溝通

这四个技能覆盖了一个严肃 bug 修复的完整生命周期。


在 Verdant 中的落地思路

虽然 9arm-skills 是为 Claude Code 设计的,但视频中提出了把它作为 Verdant 工作流蓝图的思路:

9arm-skill Verdant 落地方式 Agent 角色
Debug Mantra 调试子 Agent(project rule) 只负责复现 → 追踪 → 拒绝提前修复
Scrutinize 独立审查 Agent 在隔离 workspace 中冷眼审查
Postmortem 记录 Agent 拿到真实证据后撰写工程记录
Management Talk 沟通 Agent 把技术记录转为 Jira/Slack 更新

推荐的 Verdant 工作流

Bug Report 進來
      │
      ▼
┌───────────┐     ┌──────────────┐
│ Debugger  │────→│Implementation│
│  Agent    │     │    Agent     │
│(复現+追蹤) │     │ (隔離workspace)│
└───────────┘     └──────┬───────┘
                         │
      ┌──────────────────┤
      ▼                  ▼
┌───────────┐     ┌──────────────┐
│ Reviewer  │     │    Test      │
│  Agent    │     │   Agent      │
│(Scrutinize)│     │  (驗證修復)   │
└─────┬─────┘     └──────┬───────┘
      │                  │
      └────────┬─────────┘
               ▼
       ┌──────────────┐
       │  Postmortem  │
       │    Agent     │
       └──────┬───────┘
              ▼
       ┌──────────────┐
       │    Comms     │
       │    Agent     │
       │(Management  │
       │   Talk)      │
       └──────────────┘

落地关键原则

✅ 正確做法                        ❌ 錯誤做法
─────────────────────────────────────────────
每個 Agent 只做一件事              把所有技能塞進每個任務
在正確時機載入正確行為             全局載入所有 skill
Agent 之間隔離                     實現者自審自批
每個產出物有明確職責               調試記錄 = 復盤報告

"Do not dump every skill into every task. Use the right behavior at the right moment."


Agent 的典型失败模式

9arm-skills 精准瞄准了 Coding Agent 的四大通病:

失败模式 症状 对应 Skill
修复前不调试 Paste error → Agent 改 3 个文件 → 错误变了 → 改 4 个 Debug Mantra
自我审批太快 写代码 → 自审 → "Looks good" → 提交 Scrutinize
虚假确定性 把猜测写成 RCA,推测性根因包装成确定结论 Postmortem
受众错位 给管理层发堆栈追踪,给工程师发高管摘要 Management Talk

总结

核心洞察(一句話):

Agent performance = Model Intelligence × Workflow Intelligence

模型聰明 ≠ 工作流正確。再強的模型也需要行為約束。

9arm-skills 的价值不在于它有多少行代码或多少个技能,而在于它展示了一个重要原则:让 Agent 在它通常急躁的地方慢下来,在并行工作真正安全的地方并行化。


参考资料