Skip to content

Hermes Agent Multi-Agent Kanban Board 工作流

这篇笔记整理 YouTube 频道「Tonbi's AI Garage」展示的 Hermes Agent 多代理自主工作流。核心:用 Kanban Board 作为唯一协调层,让一群 agent 从问题发现到交付完全自主运转,只有一步需要人工审批。

目录


核心问题:多代理协调

"Everyone talks about multi-agent workflows; almost no one shows one running end-to-end without breaking."

多代理系统最难的部分不是设置 agent,而是让它们协调做一件事而不互相踩脚

没有 Kanban Board 的问题

┌─────────────────────────────────────────────────┐
│            多代理无协调的混乱场景                    │
├──────────────┬──────────────────────────────────────┤
│ 重复工作      │ 多个 agent 做同一件事,浪费 token     │
│ 无共享记忆    │ 各自为政,不知道别人做了什么           │
│ 崩溃不可恢复  │ 一个 agent 崩溃,所有进度丢失          │
│ 调度混乱      │ 没有"谁该做什么"的明确规则            │
└──────────────┴──────────────────────────────────────┘

有 Kanban Board 的解决方案

┌─────────────────────────────────────────────────┐
│            Kanban Board = 单一真相来源              │
├──────────────┬──────────────────────────────────────┤
│ 任务即卡片    │ 每个任务单元 = 一张 card              │
│ Agent 认领   │ claim → work → done,不会抢同一个任务  │
│ 持久化       │ SQLite 存盘,重启不丢状态              │
│ 审计日志     │ 所有 claim/comment/complete 全记录     │
└──────────────┴──────────────────────────────────────┘

"This is one SQLite file. That's the entire coordination layer and it's the bus and audit log all in one."


Kanban Board 架构

五大优势

优势 说明
Durable(持久) SQLite 存盘,崩溃/重启后全部可恢复
Parallel(并行) 多个 agent 同时工作,由一个 board 协调
Event-driven(事件驱动) 工作自动沿依赖图流动,无需轮询
Self-healing(自愈) 死掉的任务自动回收并重新派发
Auditable(可审计) 每次认领、评论、完成都有完整日志

任务卡片结构

Card
  ├─ title       : 任务标题
  ├─ description  : 任务详情
  ├─ assignee    : 指定给哪个 agent profile
  ├─ status      : todo / ready / in_progress / done
  └─ parents[]   : 依赖的父任务 ID

Dispatcher Loop(调度循环)

Board 有 ready 任务?
  │
  ├─ YES → Dispatcher 认领 (claim)
  │         │
  │         ├─ 启动 assignee 对应的 agent
  │         │   (独立 workspace)
  │         │
  │         ├─ Agent 完成工作 → 标记 done
  │         │
  │         └─ 下一轮循环
  │
  └─ NO → 等待下一 tick

关键:两个 agent 永远不会抢同一个任务(claim 操作保证互斥)。


完整工作流 Pipeline

端到端流程

SCOUTS → ORCHESTRATOR → RESEARCHERS → ORCHESTRATOR → HUMAN GATE → WORKERS → DELIVERABLE

Stage 1: Detect(发现)

定时运行(每小时或每天两次),两个 Scout agent 并行搜索:

Scout 模型 数据源
X Scout Grok X/Twitter 上的用户抱怨/问题
Web Scout GPT 5.5 Reddit, YouTube, Web 搜索

Stage 2: Validate(验证)

Orchestrator agent 执行: - 去重(过滤已见过的问题) - 按 rubric 打分 - 低于 65/100 自动搁置

Stage 3: Research(研究)

每个问题派 3 个 Researcher agent 并行:

问题 X
  │
  ├─ Researcher 1: Source Verifier (来源验证)
  ├─ Researcher 2: Context Researcher (背景调研)
  └─ Researcher 3: Solutions Auditor (现有方案审计)

Stage 4: Route(路由)

Orchestrator 根据研究结果决定: - Build path → 构建工具/skill - Video path → 制作教学视频 - Shelve → 搁置

Stage 5: Human Gate(人工审批)⭐ 唯一人工环节

通过 Telegram 发送待审批项: - ✅ Approve → 进入执行 - ❌ Shelve → 搁置 - ✏️ Modify → 修改后重新审批

Stage 6: Ship(交付)

Build Path:Analyst → Builder → Tester → CLI script / Skill

Video Path:Video Producer → Slides + Script + Speaker notes


Auto-Dependency 自动依赖系统

"A card will sit in todo until its parents are finished. Then it promotes itself to ready."

这是 Kanban Board 最巧妙的设计之一——卡片自动感知依赖关系

Found Task (Scout 发现一个问题)
  │
  ├─→ Research Card 1 (来源验证) ──→ Route Card ──→ Gate Card ──→ Worker Card
  ├─→ Research Card 2 (背景调研) ──┘      ↑
  └─→ Research Card 3 (方案审计) ──────────┘
                                           │
                                           └─ 最后一个 child 完成
                                               → Route Card 自动从 todo → ready

不需要轮询、不需要胶水代码、不需要手动触发。子任务完成后,父任务自动晋升为 ready 状态,下一轮 dispatcher loop 就会认领它。


Agent 舰队配置

每个 agent 只是同一台机器上的一个 Hermes profile,可以用不同模型:

Agent 模型 职责
X Scout Grok 搜索 X/Twitter 上的用户问题
Web Scout GPT 5.5 搜索 Reddit/YouTube/Web
Orchestrator GPT 5.5 中心调度:验证、打分、路由
Researcher ×3 GPT 5.5 来源验证 / 背景调研 / 方案审计
Analyst GPT 5.5 综合信息,准备 build 方案
Builder GPT 5.5 写原型代码
Tester GPT 5.5 测试交付物
Video Producer GPT 5.5 生成幻灯片、脚本、大纲

总计:每次运行 18 个 agent 并行工作。

部署方式

  • ✅ 单台机器,多 profile
  • ✅ 每个 agent 在独立 workspace 中运行
  • ✅ 不同 agent 可用不同模型(GPT 5.5 / Grok / Claude 等)
  • ✅ 所有 agent 共享同一个 Kanban Board (SQLite)

评分与过滤机制

Scoring Rubric(65 分阈值)

维度 衡量内容
Frequency 问题出现的频率
Pain Intensity 严重程度/影响力
Solvability 是否真的可解决
Solution Gap 现有方案是否不足
Strategic Fit 与频道/开发方向的契合度

过滤逻辑

发现问题 → Orchestrator 评分
  │
  ├─ ≥ 65 分 → 进入 Research 阶段
  └─ < 65 分 → 自动搁置 (shelve)

这个设计避免 agent 在低价值问题上浪费资源。


实战结果与自愈能力

运行数据

  • 18 个 agent 并行
  • 97 个任务 一次运行完成
  • 0 次崩溃 — 从头到尾没有中断

自愈案例

"The approved post-gate slides and script were written to scratch task workplaces that are no longer present... It realized this was an issue and I didn't tell it this. It did this autonomously."

系统发现交付物引用了已被删除的临时 workspace,自主重新生成了视频幻灯片到持久化输出目录——无需人工干预。

交付物类型

类型 产出
Build CLI script、Hermes Skill
Video 幻灯片、脚本、Speaker Notes
Research 综合报告(带来源引用)

何时适用这种模式

适合

  • ✅ 需要持续监控外部信息源并自主行动
  • ✅ 任务可分解为明确的阶段和角色
  • ✅ 多个 agent 需要协调但不频繁通信
  • ✅ 任务需要持久化(不能因崩溃丢失进度)
  • ✅ 需要审计追踪(谁做了什么、何时做的)

不适合

  • ❌ 简单的单步任务(一个 agent 就够)
  • ❌ Agent 之间需要频繁实时通信(Kanban 是异步的)
  • ❌ 任务完全不可预测,无法提前定义角色分工
  • ❌ Token 预算极低

判断决策树

你的任务需要多个 agent 协作吗?
  │
  ├─ 否 → 用单 agent + delegate_task
  │
  └─ 是 → 任务需要持久化 / 崩溃恢复吗?
        │
        ├─ 否 → 用 delegate_task 批量
        │
        └─ 是 → 任务有明确阶段分工吗?
              │
              ├─ 否 → 重新设计任务分解
              │
              └─ 是 → ✅ 用 Kanban Board 工作流

参考资料