Hermes Agent vs OpenClaw — AI 智能体工作流进化论¶
当你敲下一行 prompt,你只是在指挥一个工人;当你敲下斜杠目标指令,你是在管理一个团队;当你配置多智能体生态,你是在搭建一家公司。这是 AI Agent 时代的工作流哲学。
目录¶
- 一、工程路径分歧:激进实验 vs 稳定基石
- 二、看板革命:从单线程排队到多智能体并行
- 三、图书管理员与微观架构
- 四、斜杠目标指令与使命管理
- 五、记忆管理:压缩阈值 + Curator
- 六、总结:数字组织设计者的时代
- 参考资料
一、工程路径分歧:激进实验 vs 稳定基石¶
视频用一个精准比喻开场:你拥有一辆世界顶级跑车,但每天早上要花半小时钻进车底修补引擎才能上路——这正是当前 AI Agent 圈的真实写照。
两条路线对比¶
OpenClaw Hermes
-------- ------
工程哲学 激进实验主义 稳定基础设施
更新频率 几乎每天推送 有明确主题和清晰叙述
用户体验 "救火队员" "数字 CEO"
核心追求 探索边界 近乎苛刻的稳定性
社区反馈 大量崩溃/兼容性问题 热度指数级飙升
OpenClaw 的困境: - 狂飙式更新导致底层架构频繁断裂 - 用户每天被迫浪费大量时间修复崩溃系统 - 安全事件频发:恶意社区 Skills、prompt 注入、凭据泄露 - 2026 年初,"OpenClaw is dead" 成为开发者论坛热词
Hermes 的策略: - 每次更新有明确主题,用户知道系统在哪个维度进化 - 不盲目追求功能竞赛,优先保证系统稳定性 - 提供完整的 Dashboard 可视化界面
注意:OpenClaw 在技术上仍然活跃(GitHub 仍有提交),但在声誉、信任和采用率上已严重受损。2026 年 5 月 Medium 文章"OpenClaw is Dead"详细分析了这一衰退过程。
二、看板革命:从单线程排队到多智能体并行¶
传统单线程的痛点¶
传统 AI 智能体处理任务像串行下棋——下达指令后只能等待返回,才能进行下一步。所有任务塞进一个队列排队,这在现代工作流中是致命瓶颈。
Hermes 看板机制¶
Hermes 看板将单人游戏变成同时面对 30 个棋盘的表演赛,支持 10-30 个并行工作:
+------------------------------------------------------------------+
| Hermes Kanban 看板流程 |
+------------------------------------------------------------------+
| |
| [TODO] ----> [READY] ----> [IN PROGRESS] ----> [DONE] |
| 粗略想法 就绪等待 智能体执行 完成 |
| |
| 示例: |
| 1. "讨论招聘" --> researcher --> 完成 |
| 2. "给设计师发消息" --> ops --> 完成 |
| 3. "修改网站配色" --> dev --> 完成 --> push 到 GitHub |
| (任务3依赖任务2完成后才能push) |
| |
+------------------------------------------------------------------+
核心特性¶
- 状态流转:
triage → todo → ready → running → blocked/done → archived - 任务依赖:支持 parent → child 链接,所有 parent 完成后自动 promote 子任务
- 多人协作:不同 profile 的智能体可以各自领取任务
- 持久化:所有任务存储在
~/.hermes/kanban.db(SQLite) - Dashboard:内置可视化面板,支持拖拽、实时 WebSocket 更新
Kanban vs delegate_task¶
+------------------+----------------------+---------------------+
| | delegate_task | Kanban |
+------------------+----------------------+---------------------+
| 形态 | RPC 调用 (fork→join) | 持久消息队列+状态机 |
| 父进程 | 阻塞等待子进程返回 | 创建后 fire-and-forget|
| 子进程身份 | 匿名子智能体 | 命名 profile+持久记忆|
| 可恢复性 | 失败即失败 | block→unblock→重跑 |
| 人工介入 | 不支持 | 随时 comment/unblock |
| 审计追踪 | 上下文压缩后丢失 | SQLite 永久记录 |
+------------------+----------------------+---------------------+
视频演示场景¶
视频演示了一个 Telegram 看板工作流: 1. 同时下达 3 个任务(读 Hacker News、改网站配色、push 代码) 2. 系统自动分配给不同智能体并行执行 3. 任务 3 依赖任务 2 完成后才能 push 4. Dashboard 实时查看进度
关键注意:分配任务时需明确指定执行者,否则会出现"无人接单"的等待情况。
三、图书管理员与微观架构¶
问题:谁来管理管理者?¶
看板每天流转 20-30 个任务,如果每个粗略想法都需要手动补充背景细节、附链接、写明目标——花在管理看板上的时间比亲手干活还多。
解决方案:图书管理员智能体¶
+--------------------------------------------------------------+
| Librarian 工作流程 |
+--------------------------------------------------------------+
| |
| [Cron 定时器] |
| | 每 10 分钟触发一次 |
| v |
| [检查 TODO 栏] |
| | 发现 "规划视频" 等粗略想法 |
| v |
| [搜索知识库] |
| | 潜入授权的本地笔记 |
| | 解锁过去 3 个月相关碎片素材 |
| v |
| [生成任务卡片] |
| | 包含详细背景、相关链接、明确目标 |
| v |
| [推送到 READY 栏] |
| | 等待分配给主智能体执行 |
| v |
| [人类确认] → 执行 |
| |
+--------------------------------------------------------------+
微观架构的核心原则¶
+---------------------------+----------------------------------+
| 高频低复杂度任务 | 使用低成本/免费模型 |
| (每10分钟刷新、整理碎片) | (Librarian / 行政智能体) |
+---------------------------+----------------------------------+
| 低频高复杂度任务 | 使用高成本顶级模型 |
| (深度代码研究、架构推理) | (主智能体 / Coding Agent) |
+---------------------------+----------------------------------+
类比:让跨国公司 CEO 坐在前台签收快递——用低成本模型做高频行政,用高成本模型做低频深度思考。
成本控制要点¶
- 让顶级模型(如 DeepSeek V4 Pro)每 10 分钟刷网页做行政工作 → API 账单爆炸
- 正确做法:Librarian 运行在极其廉价甚至免费的模型上
- 主智能体只在需要深度推理时才调用
四、斜杠目标指令与使命管理¶
从 Prompt 到 Mission¶
传统 prompt 是让 AI 执行一个短期动作,而 Hermes 的斜杠目标指令(/goal)赋予 AI 一个真正的使命。
+------------------------------------------------------------------+
| /goal 自主执行循环 |
+------------------------------------------------------------------+
| |
| 用户下达使命 |
| | |
| v |
| [AI 自主规划] ←── 建立规划图 |
| | |
| v |
| [自主执行] ←── 抓取、评估、处理 |
| | |
| v |
| [遇到错误] ←── 自动尝试另一条路径 |
| | |
| v |
| [连续运行] ←── 可连续运行数天 |
| |
+------------------------------------------------------------------+
安全策略:用魔法打败魔法¶
自主性越强,风险越大。两个安全策略:
策略一:用大模型约束小智能体 - 让顶级大模型(Claude / Gemini)编写极其详尽的 Fleego 指令 - 包含严格的修改权限限制和错误回滚预案
策略二:反向提示(Reverse Prompting) - 不让 AI 直接执行,而是先读取记录 - 汇报几个值得挖掘的目标选项 + 安全方案 - 人类只负责审批签字
最佳实践对比:
+-------------------+------------------------+-----------------------+
| | 危险做法 | 安全做法 |
+-------------------+------------------------+-----------------------+
| 示例 | "/goal 清理我的文件" | 反向提示+审批流程 |
| 风险 | 可能删除多年心血 | AI 提方案→人类确认 |
| 控制权 | AI 全权操作 | 人类最终决策 |
+-------------------+------------------------+-----------------------+
五、记忆管理:压缩阈值 + Curator¶
防守策略:可调节压缩阈值(Compression Threshold)¶
当上下文窗口用满一半时,系统启动温和的摘要协议,将核心逻辑浓缩成 summary 保留——保护连贯性。
压缩阈值调优指南:
+------------------+------------------+--------------------------------+
| 阈值 | 适用场景 | 特点 |
+------------------+------------------+--------------------------------+
| 0.5(默认) | 普通闲聊/轻任务 | 最安全省钱,但可能不够聪明 |
| 0.75 | 复杂代码库研究 | 推荐给高级 Coding Agent |
| 0.8 | 逆向工程/长推理 | 依赖原始上下文的硬核任务 |
| 关闭自动压缩 | 配合向量记忆 | 高级玩家方案 |
+------------------+------------------+--------------------------------+
⚠ 过早压缩的代价:
- Agent 越来越依赖总结而非原文
- 容易发生语义漂移(Semantic Drift)
- 长对话中丢失关键上下文
视频作者实战经验: - 维护名为 OmniHunter 的量化认知系统,需长时间代码研究和多智能体编排 - 使用默认 0.5 + 廉价模型 → Agent 还没建立完整思维模型就被压缩 - 推荐复杂场景设 0.75~0.8
反击策略:Curator(自动修剪机制)¶
Curator 是一个后台运行的自动修剪系统:
+------------------------------------------------------------------+
| Curator 工作周期(每 7 天) |
+------------------------------------------------------------------+
| |
| [扫描所有智能体的日志] |
| | |
| v |
| [识别过去 30 天未触发的深层记忆和技能] |
| | |
| v |
| [毫不留情地删除它们] |
| | |
| v |
| [系统自我瘦身] |
| | |
| v |
| [保持记忆精确性,不膨胀不臃肿] |
| |
+------------------------------------------------------------------+
效果:系统不仅没有变臃肿,反而在自我审视中实现了瘦身。
完整记忆管理架构¶
+-------------------+
| 新记忆写入 |
+--------+----------+
|
+--------v----------+
| 压缩阈值 (0.5~0.8) |
| 上下文满50%时摘要 |
+--------+----------+
|
+--------v----------+
| Curator (7天周期) |
| 删除30天未用记忆 |
+--------+----------+
|
+--------v----------+
| 精确持久记忆 |
| 不膨胀、不漂移 |
+-------------------+
六、总结:数字组织设计者的时代¶
进化本质¶
Hermes 的进化核心不是盲目狂飙,而是选择稳定路线: - 可调节压缩阈值 → 保护记忆连贯性 - Curator 自动修剪 → 系统自我瘦身 - 斜杠目标指令 → 赋予长期使命 - 看板 + 图书管理员 → 多智能体并行协作
人类角色演进¶
+-------------------------+------------------------------------------+
| 你做的事 | 你的角色 |
+-------------------------+------------------------------------------+
| 敲一行 prompt | 指挥一个工人 |
| 敲斜杠目标指令 | 管理一个团队 |
| 配置多智能体生态 | 搭建一家公司 |
| 引入 Librarian + Curator | 建立一套组织治理体系 |
+-------------------------+------------------------------------------+
核心转变:从单纯的劳动者和工具使用者 → 数字组织设计者
关键能力排序:
1. 定义系统结构
2. 化安全边界
3. 设定核心目标
4. 价值排序
> "懂得如何定义系统结构、化安全边界、设定核心目标以及进行价值排序,
> 已经比知道如何干活要重要 1 万倍。"
参考资料¶
- Hermes Agent Kanban 官方文档
- OpenClaw is Dead - Medium
- Multi-Agent Workflows — Kanban, Delegation & Advanced Patterns (Reddit)
- Hermes Agent v0.13 — Multi-Agent Kanban Is Here (YouTube)
- Microsoft: Running OpenClaw safely
相关笔记¶
- [[Hermes Agent 配置指南]]
- [[AI Agent 安全性分析]]