Hermes Agent vs OpenClaw — AI 智能体工作流进化论¶

当你敲下一行 prompt，你只是在指挥一个工人；当你敲下斜杠目标指令，你是在管理一个团队；当你配置多智能体生态，你是在搭建一家公司。这是 AI Agent 时代的工作流哲学。

目录¶

一、工程路径分歧：激进实验 vs 稳定基石
二、看板革命：从单线程排队到多智能体并行
三、图书管理员与微观架构
四、斜杠目标指令与使命管理
五、记忆管理：压缩阈值 + Curator
六、总结：数字组织设计者的时代
参考资料

一、工程路径分歧：激进实验 vs 稳定基石¶

视频用一个精准比喻开场：你拥有一辆世界顶级跑车，但每天早上要花半小时钻进车底修补引擎才能上路——这正是当前 AI Agent 圈的真实写照。

两条路线对比¶

                    OpenClaw                    Hermes
                    --------                    ------
工程哲学            激进实验主义                 稳定基础设施
更新频率            几乎每天推送                  有明确主题和清晰叙述
用户体验            "救火队员"                   "数字 CEO"
核心追求            探索边界                     近乎苛刻的稳定性
社区反馈            大量崩溃/兼容性问题           热度指数级飙升

OpenClaw 的困境： - 狂飙式更新导致底层架构频繁断裂 - 用户每天被迫浪费大量时间修复崩溃系统 - 安全事件频发：恶意社区 Skills、prompt 注入、凭据泄露 - 2026 年初，"OpenClaw is dead" 成为开发者论坛热词

Hermes 的策略： - 每次更新有明确主题，用户知道系统在哪个维度进化 - 不盲目追求功能竞赛，优先保证系统稳定性 - 提供完整的 Dashboard 可视化界面

注意：OpenClaw 在技术上仍然活跃（GitHub 仍有提交），但在声誉、信任和采用率上已严重受损。2026 年 5 月 Medium 文章"OpenClaw is Dead"详细分析了这一衰退过程。

二、看板革命：从单线程排队到多智能体并行¶

传统单线程的痛点¶

传统 AI 智能体处理任务像串行下棋——下达指令后只能等待返回，才能进行下一步。所有任务塞进一个队列排队，这在现代工作流中是致命瓶颈。

Hermes 看板机制¶

Hermes 看板将单人游戏变成同时面对 30 个棋盘的表演赛，支持 10-30 个并行工作：

+------------------------------------------------------------------+
|                    Hermes Kanban 看板流程                         |
+------------------------------------------------------------------+
|                                                                  |
|  [TODO]  ---->  [READY]  ---->  [IN PROGRESS]  ---->  [DONE]    |
|  粗略想法       就绪等待        智能体执行           完成          |
|                                                                  |
|  示例：                                                          |
|  1. "讨论招聘"  --> researcher --> 完成                           |
|  2. "给设计师发消息" --> ops --> 完成                              |
|  3. "修改网站配色" --> dev --> 完成 --> push 到 GitHub             |
|                         (任务3依赖任务2完成后才能push)             |
|                                                                  |
+------------------------------------------------------------------+

核心特性¶

状态流转：triage → todo → ready → running → blocked/done → archived
任务依赖：支持 parent → child 链接，所有 parent 完成后自动 promote 子任务
多人协作：不同 profile 的智能体可以各自领取任务
持久化：所有任务存储在 ~/.hermes/kanban.db（SQLite）
Dashboard：内置可视化面板，支持拖拽、实时 WebSocket 更新

Kanban vs delegate_task¶

+------------------+----------------------+---------------------+
|                  | delegate_task        | Kanban              |
+------------------+----------------------+---------------------+
| 形态             | RPC 调用 (fork→join) | 持久消息队列+状态机 |
| 父进程           | 阻塞等待子进程返回    | 创建后 fire-and-forget|
| 子进程身份       | 匿名子智能体         | 命名 profile+持久记忆|
| 可恢复性         | 失败即失败           | block→unblock→重跑   |
| 人工介入         | 不支持               | 随时 comment/unblock |
| 审计追踪         | 上下文压缩后丢失     | SQLite 永久记录      |
+------------------+----------------------+---------------------+

视频演示场景¶

视频演示了一个 Telegram 看板工作流： 1. 同时下达 3 个任务（读 Hacker News、改网站配色、push 代码） 2. 系统自动分配给不同智能体并行执行 3. 任务 3 依赖任务 2 完成后才能 push 4. Dashboard 实时查看进度

关键注意：分配任务时需明确指定执行者，否则会出现"无人接单"的等待情况。

三、图书管理员与微观架构¶

问题：谁来管理管理者？¶

看板每天流转 20-30 个任务，如果每个粗略想法都需要手动补充背景细节、附链接、写明目标——花在管理看板上的时间比亲手干活还多。

解决方案：图书管理员智能体¶

+--------------------------------------------------------------+
|                    Librarian 工作流程                         |
+--------------------------------------------------------------+
|                                                              |
|  [Cron 定时器]                                                |
|       |  每 10 分钟触发一次                                    |
|       v                                                      |
|  [检查 TODO 栏]                                               |
|       |  发现 "规划视频" 等粗略想法                            |
|       v                                                      |
|  [搜索知识库]                                                 |
|       |  潜入授权的本地笔记                                    |
|       |  解锁过去 3 个月相关碎片素材                           |
|       v                                                      |
|  [生成任务卡片]                                               |
|       |  包含详细背景、相关链接、明确目标                       |
|       v                                                      |
|  [推送到 READY 栏]                                            |
|       |  等待分配给主智能体执行                                |
|       v                                                      |
|  [人类确认] → 执行                                            |
|                                                              |
+--------------------------------------------------------------+

微观架构的核心原则¶

+---------------------------+----------------------------------+
| 高频低复杂度任务           | 使用低成本/免费模型              |
| (每10分钟刷新、整理碎片)  | (Librarian / 行政智能体)         |
+---------------------------+----------------------------------+
| 低频高复杂度任务           | 使用高成本顶级模型              |
| (深度代码研究、架构推理)  | (主智能体 / Coding Agent)        |
+---------------------------+----------------------------------+

类比：让跨国公司 CEO 坐在前台签收快递——用低成本模型做高频行政，用高成本模型做低频深度思考。

成本控制要点¶

让顶级模型（如 DeepSeek V4 Pro）每 10 分钟刷网页做行政工作 → API 账单爆炸
正确做法：Librarian 运行在极其廉价甚至免费的模型上
主智能体只在需要深度推理时才调用

四、斜杠目标指令与使命管理¶

从 Prompt 到 Mission¶

传统 prompt 是让 AI 执行一个短期动作，而 Hermes 的斜杠目标指令（/goal）赋予 AI 一个真正的使命。

+------------------------------------------------------------------+
|               /goal 自主执行循环                                  |
+------------------------------------------------------------------+
|                                                                  |
|  用户下达使命                                                     |
|       |                                                          |
|       v                                                          |
|  [AI 自主规划]  ←── 建立规划图                                    |
|       |                                                          |
|       v                                                          |
|  [自主执行]    ←── 抓取、评估、处理                               |
|       |                                                          |
|       v                                                          |
|  [遇到错误]    ←── 自动尝试另一条路径                             |
|       |                                                          |
|       v                                                          |
|  [连续运行]    ←── 可连续运行数天                                 |
|                                                                  |
+------------------------------------------------------------------+

安全策略：用魔法打败魔法¶

自主性越强，风险越大。两个安全策略：

策略一：用大模型约束小智能体 - 让顶级大模型（Claude / Gemini）编写极其详尽的 Fleego 指令 - 包含严格的修改权限限制和错误回滚预案

策略二：反向提示（Reverse Prompting） - 不让 AI 直接执行，而是先读取记录 - 汇报几个值得挖掘的目标选项 + 安全方案 - 人类只负责审批签字

最佳实践对比：

+-------------------+------------------------+-----------------------+
|                   | 危险做法                | 安全做法              |
+-------------------+------------------------+-----------------------+
| 示例               | "/goal 清理我的文件"    | 反向提示+审批流程      |
| 风险               | 可能删除多年心血        | AI 提方案→人类确认    |
| 控制权             | AI 全权操作             | 人类最终决策          |
+-------------------+------------------------+-----------------------+

五、记忆管理：压缩阈值 + Curator¶

防守策略：可调节压缩阈值（Compression Threshold）¶

当上下文窗口用满一半时，系统启动温和的摘要协议，将核心逻辑浓缩成 summary 保留——保护连贯性。

压缩阈值调优指南：

+------------------+------------------+--------------------------------+
| 阈值             | 适用场景         | 特点                           |
+------------------+------------------+--------------------------------+
| 0.5（默认）      | 普通闲聊/轻任务  | 最安全省钱，但可能不够聪明     |
| 0.75             | 复杂代码库研究   | 推荐给高级 Coding Agent        |
| 0.8              | 逆向工程/长推理  | 依赖原始上下文的硬核任务       |
| 关闭自动压缩     | 配合向量记忆     | 高级玩家方案                   |
+------------------+------------------+--------------------------------+

⚠ 过早压缩的代价：
   - Agent 越来越依赖总结而非原文
   - 容易发生语义漂移（Semantic Drift）
   - 长对话中丢失关键上下文

视频作者实战经验： - 维护名为 OmniHunter 的量化认知系统，需长时间代码研究和多智能体编排 - 使用默认 0.5 + 廉价模型 → Agent 还没建立完整思维模型就被压缩 - 推荐复杂场景设 0.75~0.8

反击策略：Curator（自动修剪机制）¶

Curator 是一个后台运行的自动修剪系统：

+------------------------------------------------------------------+
|                    Curator 工作周期（每 7 天）                     |
+------------------------------------------------------------------+
|                                                                  |
|  [扫描所有智能体的日志]                                           |
|       |                                                          |
|       v                                                          |
|  [识别过去 30 天未触发的深层记忆和技能]                           |
|       |                                                          |
|       v                                                          |
|  [毫不留情地删除它们]                                             |
|       |                                                          |
|       v                                                          |
|  [系统自我瘦身]                                                   |
|       |                                                          |
|       v                                                          |
|  [保持记忆精确性，不膨胀不臃肿]                                   |
|                                                                  |
+------------------------------------------------------------------+

效果：系统不仅没有变臃肿，反而在自我审视中实现了瘦身。

完整记忆管理架构¶

                    +-------------------+
                    |   新记忆写入       |
                    +--------+----------+
                             |
                    +--------v----------+
                    | 压缩阈值 (0.5~0.8) |
                    | 上下文满50%时摘要  |
                    +--------+----------+
                             |
                    +--------v----------+
                    | Curator (7天周期)  |
                    | 删除30天未用记忆   |
                    +--------+----------+
                             |
                    +--------v----------+
                    |   精确持久记忆     |
                    | 不膨胀、不漂移     |
                    +-------------------+

六、总结：数字组织设计者的时代¶

进化本质¶

Hermes 的进化核心不是盲目狂飙，而是选择稳定路线： - 可调节压缩阈值 → 保护记忆连贯性 - Curator 自动修剪 → 系统自我瘦身 - 斜杠目标指令 → 赋予长期使命 - 看板 + 图书管理员 → 多智能体并行协作

人类角色演进¶

+-------------------------+------------------------------------------+
| 你做的事                 | 你的角色                                 |
+-------------------------+------------------------------------------+
| 敲一行 prompt            | 指挥一个工人                             |
| 敲斜杠目标指令           | 管理一个团队                             |
| 配置多智能体生态          | 搭建一家公司                             |
| 引入 Librarian + Curator | 建立一套组织治理体系                     |
+-------------------------+------------------------------------------+

核心转变：从单纯的劳动者和工具使用者 → 数字组织设计者

关键能力排序：
1. 定义系统结构
2. 化安全边界
3. 设定核心目标
4. 价值排序

> "懂得如何定义系统结构、化安全边界、设定核心目标以及进行价值排序，
> 已经比知道如何干活要重要 1 万倍。"