Skip to content

Hermes Agent vs OpenClaw — AI 智能体工作流进化论

当你敲下一行 prompt,你只是在指挥一个工人;当你敲下斜杠目标指令,你是在管理一个团队;当你配置多智能体生态,你是在搭建一家公司。这是 AI Agent 时代的工作流哲学。


目录


一、工程路径分歧:激进实验 vs 稳定基石

视频用一个精准比喻开场:你拥有一辆世界顶级跑车,但每天早上要花半小时钻进车底修补引擎才能上路——这正是当前 AI Agent 圈的真实写照。

两条路线对比

                    OpenClaw                    Hermes
                    --------                    ------
工程哲学            激进实验主义                 稳定基础设施
更新频率            几乎每天推送                  有明确主题和清晰叙述
用户体验            "救火队员"                   "数字 CEO"
核心追求            探索边界                     近乎苛刻的稳定性
社区反馈            大量崩溃/兼容性问题           热度指数级飙升

OpenClaw 的困境: - 狂飙式更新导致底层架构频繁断裂 - 用户每天被迫浪费大量时间修复崩溃系统 - 安全事件频发:恶意社区 Skills、prompt 注入、凭据泄露 - 2026 年初,"OpenClaw is dead" 成为开发者论坛热词

Hermes 的策略: - 每次更新有明确主题,用户知道系统在哪个维度进化 - 不盲目追求功能竞赛,优先保证系统稳定性 - 提供完整的 Dashboard 可视化界面

注意:OpenClaw 在技术上仍然活跃(GitHub 仍有提交),但在声誉、信任和采用率上已严重受损。2026 年 5 月 Medium 文章"OpenClaw is Dead"详细分析了这一衰退过程。


二、看板革命:从单线程排队到多智能体并行

传统单线程的痛点

传统 AI 智能体处理任务像串行下棋——下达指令后只能等待返回,才能进行下一步。所有任务塞进一个队列排队,这在现代工作流中是致命瓶颈。

Hermes 看板机制

Hermes 看板将单人游戏变成同时面对 30 个棋盘的表演赛,支持 10-30 个并行工作:

+------------------------------------------------------------------+
|                    Hermes Kanban 看板流程                         |
+------------------------------------------------------------------+
|                                                                  |
|  [TODO]  ---->  [READY]  ---->  [IN PROGRESS]  ---->  [DONE]    |
|  粗略想法       就绪等待        智能体执行           完成          |
|                                                                  |
|  示例:                                                          |
|  1. "讨论招聘"  --> researcher --> 完成                           |
|  2. "给设计师发消息" --> ops --> 完成                              |
|  3. "修改网站配色" --> dev --> 完成 --> push 到 GitHub             |
|                         (任务3依赖任务2完成后才能push)             |
|                                                                  |
+------------------------------------------------------------------+

核心特性

  • 状态流转triage → todo → ready → running → blocked/done → archived
  • 任务依赖:支持 parent → child 链接,所有 parent 完成后自动 promote 子任务
  • 多人协作:不同 profile 的智能体可以各自领取任务
  • 持久化:所有任务存储在 ~/.hermes/kanban.db(SQLite)
  • Dashboard:内置可视化面板,支持拖拽、实时 WebSocket 更新

Kanban vs delegate_task

+------------------+----------------------+---------------------+
|                  | delegate_task        | Kanban              |
+------------------+----------------------+---------------------+
| 形态             | RPC 调用 (fork→join) | 持久消息队列+状态机 |
| 父进程           | 阻塞等待子进程返回    | 创建后 fire-and-forget|
| 子进程身份       | 匿名子智能体         | 命名 profile+持久记忆|
| 可恢复性         | 失败即失败           | block→unblock→重跑   |
| 人工介入         | 不支持               | 随时 comment/unblock |
| 审计追踪         | 上下文压缩后丢失     | SQLite 永久记录      |
+------------------+----------------------+---------------------+

视频演示场景

视频演示了一个 Telegram 看板工作流: 1. 同时下达 3 个任务(读 Hacker News、改网站配色、push 代码) 2. 系统自动分配给不同智能体并行执行 3. 任务 3 依赖任务 2 完成后才能 push 4. Dashboard 实时查看进度

关键注意:分配任务时需明确指定执行者,否则会出现"无人接单"的等待情况。


三、图书管理员与微观架构

问题:谁来管理管理者?

看板每天流转 20-30 个任务,如果每个粗略想法都需要手动补充背景细节、附链接、写明目标——花在管理看板上的时间比亲手干活还多。

解决方案:图书管理员智能体

+--------------------------------------------------------------+
|                    Librarian 工作流程                         |
+--------------------------------------------------------------+
|                                                              |
|  [Cron 定时器]                                                |
|       |  每 10 分钟触发一次                                    |
|       v                                                      |
|  [检查 TODO 栏]                                               |
|       |  发现 "规划视频" 等粗略想法                            |
|       v                                                      |
|  [搜索知识库]                                                 |
|       |  潜入授权的本地笔记                                    |
|       |  解锁过去 3 个月相关碎片素材                           |
|       v                                                      |
|  [生成任务卡片]                                               |
|       |  包含详细背景、相关链接、明确目标                       |
|       v                                                      |
|  [推送到 READY 栏]                                            |
|       |  等待分配给主智能体执行                                |
|       v                                                      |
|  [人类确认] → 执行                                            |
|                                                              |
+--------------------------------------------------------------+

微观架构的核心原则

+---------------------------+----------------------------------+
| 高频低复杂度任务           | 使用低成本/免费模型              |
| (每10分钟刷新、整理碎片)  | (Librarian / 行政智能体)         |
+---------------------------+----------------------------------+
| 低频高复杂度任务           | 使用高成本顶级模型              |
| (深度代码研究、架构推理)  | (主智能体 / Coding Agent)        |
+---------------------------+----------------------------------+

类比:让跨国公司 CEO 坐在前台签收快递——用低成本模型做高频行政,用高成本模型做低频深度思考。

成本控制要点

  • 让顶级模型(如 DeepSeek V4 Pro)每 10 分钟刷网页做行政工作 → API 账单爆炸
  • 正确做法:Librarian 运行在极其廉价甚至免费的模型上
  • 主智能体只在需要深度推理时才调用

四、斜杠目标指令与使命管理

从 Prompt 到 Mission

传统 prompt 是让 AI 执行一个短期动作,而 Hermes 的斜杠目标指令(/goal)赋予 AI 一个真正的使命

+------------------------------------------------------------------+
|               /goal 自主执行循环                                  |
+------------------------------------------------------------------+
|                                                                  |
|  用户下达使命                                                     |
|       |                                                          |
|       v                                                          |
|  [AI 自主规划]  ←── 建立规划图                                    |
|       |                                                          |
|       v                                                          |
|  [自主执行]    ←── 抓取、评估、处理                               |
|       |                                                          |
|       v                                                          |
|  [遇到错误]    ←── 自动尝试另一条路径                             |
|       |                                                          |
|       v                                                          |
|  [连续运行]    ←── 可连续运行数天                                 |
|                                                                  |
+------------------------------------------------------------------+

安全策略:用魔法打败魔法

自主性越强,风险越大。两个安全策略:

策略一:用大模型约束小智能体 - 让顶级大模型(Claude / Gemini)编写极其详尽的 Fleego 指令 - 包含严格的修改权限限制和错误回滚预案

策略二:反向提示(Reverse Prompting) - 不让 AI 直接执行,而是先读取记录 - 汇报几个值得挖掘的目标选项 + 安全方案 - 人类只负责审批签字

最佳实践对比:

+-------------------+------------------------+-----------------------+
|                   | 危险做法                | 安全做法              |
+-------------------+------------------------+-----------------------+
| 示例               | "/goal 清理我的文件"    | 反向提示+审批流程      |
| 风险               | 可能删除多年心血        | AI 提方案→人类确认    |
| 控制权             | AI 全权操作             | 人类最终决策          |
+-------------------+------------------------+-----------------------+

五、记忆管理:压缩阈值 + Curator

防守策略:可调节压缩阈值(Compression Threshold)

当上下文窗口用满一半时,系统启动温和的摘要协议,将核心逻辑浓缩成 summary 保留——保护连贯性。

压缩阈值调优指南:

+------------------+------------------+--------------------------------+
| 阈值             | 适用场景         | 特点                           |
+------------------+------------------+--------------------------------+
| 0.5(默认)      | 普通闲聊/轻任务  | 最安全省钱,但可能不够聪明     |
| 0.75             | 复杂代码库研究   | 推荐给高级 Coding Agent        |
| 0.8              | 逆向工程/长推理  | 依赖原始上下文的硬核任务       |
| 关闭自动压缩     | 配合向量记忆     | 高级玩家方案                   |
+------------------+------------------+--------------------------------+

⚠ 过早压缩的代价:
   - Agent 越来越依赖总结而非原文
   - 容易发生语义漂移(Semantic Drift)
   - 长对话中丢失关键上下文

视频作者实战经验: - 维护名为 OmniHunter 的量化认知系统,需长时间代码研究和多智能体编排 - 使用默认 0.5 + 廉价模型 → Agent 还没建立完整思维模型就被压缩 - 推荐复杂场景设 0.75~0.8

反击策略:Curator(自动修剪机制)

Curator 是一个后台运行的自动修剪系统:

+------------------------------------------------------------------+
|                    Curator 工作周期(每 7 天)                     |
+------------------------------------------------------------------+
|                                                                  |
|  [扫描所有智能体的日志]                                           |
|       |                                                          |
|       v                                                          |
|  [识别过去 30 天未触发的深层记忆和技能]                           |
|       |                                                          |
|       v                                                          |
|  [毫不留情地删除它们]                                             |
|       |                                                          |
|       v                                                          |
|  [系统自我瘦身]                                                   |
|       |                                                          |
|       v                                                          |
|  [保持记忆精确性,不膨胀不臃肿]                                   |
|                                                                  |
+------------------------------------------------------------------+

效果:系统不仅没有变臃肿,反而在自我审视中实现了瘦身。

完整记忆管理架构

                    +-------------------+
                    |   新记忆写入       |
                    +--------+----------+
                             |
                    +--------v----------+
                    | 压缩阈值 (0.5~0.8) |
                    | 上下文满50%时摘要  |
                    +--------+----------+
                             |
                    +--------v----------+
                    | Curator (7天周期)  |
                    | 删除30天未用记忆   |
                    +--------+----------+
                             |
                    +--------v----------+
                    |   精确持久记忆     |
                    | 不膨胀、不漂移     |
                    +-------------------+

六、总结:数字组织设计者的时代

进化本质

Hermes 的进化核心不是盲目狂飙,而是选择稳定路线: - 可调节压缩阈值 → 保护记忆连贯性 - Curator 自动修剪 → 系统自我瘦身 - 斜杠目标指令 → 赋予长期使命 - 看板 + 图书管理员 → 多智能体并行协作

人类角色演进

+-------------------------+------------------------------------------+
| 你做的事                 | 你的角色                                 |
+-------------------------+------------------------------------------+
| 敲一行 prompt            | 指挥一个工人                             |
| 敲斜杠目标指令           | 管理一个团队                             |
| 配置多智能体生态          | 搭建一家公司                             |
| 引入 Librarian + Curator | 建立一套组织治理体系                     |
+-------------------------+------------------------------------------+

核心转变:从单纯的劳动者和工具使用者 → 数字组织设计者

关键能力排序:
1. 定义系统结构
2. 化安全边界
3. 设定核心目标
4. 价值排序

> "懂得如何定义系统结构、化安全边界、设定核心目标以及进行价值排序,
> 已经比知道如何干活要重要 1 万倍。"

参考资料

相关笔记

  • [[Hermes Agent 配置指南]]
  • [[AI Agent 安全性分析]]