Skip to content

Hermes Agent Workspace - 多 Agent 团队搭建实战

Hermes Agent Workspace 是 Hermes Agent(Nous Research 出品)的原生 Web UI。它提供了统一的可视化界面来与 Agent 聊天、管理记忆、编辑 Skill、调试执行过程,以及最关键的 — 多 Agent 编排。本笔记覆盖完整工作流:VPS 部署、创建专业子 Agent(Operators)、管理任务流水线、定时调度、以及启动自主蜂群任务。

目录


架构概览

Hermes Workspace 采用层级式 Agent 架构:

+------------------------------------------+
|          主 Agent(编排者)                |
|  - 接收用户指令                            |
|  - 协调子 Agent                            |
|  - 管理任务生命周期                         |
+------------------------------------------+
         |              |              |
    +---------+    +---------+    +---------+
    |Operator A|    |Operator B|    |Operator C|
    |(Scout)   |    |(Forge)   |    |(Pulse)   |
    |研究分析  |    |脚本撰写  |    |SEO 优化   |
    +---------+    +---------+    +---------+

三种编排模式:

模式 工作方式 适用场景
Operators 手动创建子 Agent 并分配任务 需要精细控制的逐步工作流
Swarm/Mission 主 Agent 自动发现 Agent、拆解任务、分配工作 复杂的端到端任务
Warm Agents 自主运行的后台 Agent,无需对话 定期执行的后台任务

VPS 部署

为什么用 VPS(而非本地机器)

⚠️ 安全第一:AI Agent 拥有文件系统访问权限。Prompt 注入可能导致密码、照片、文件泄露。务必在不含个人数据的 VPS 上隔离运行。 这适用于所有 AI Agent — Hermes、Claude Code、OpenHands 等。

+------------------+     +------------------+
|   本地机器        |     |   VPS (Hostinger)|
|   - 个人数据      |     |   - 仅运行 Hermes |
|   - 密码          |     |   - 无个人文件     |
|   - 照片          |     |                    |
+------------------+     +------------------+

推荐配置

组件 最低要求 推荐配置
CPU 2 核 2+ 核(KVM)
内存 4 GB 8 GB(日常定时任务必需)
存储 20 GB SSD 40 GB+ SSD
服务商 任意 VPS Hostinger(一键部署)

部署步骤

  1. 选择 Hostinger KVM2 套餐(2 CPU、8 GB RAM)— 适合自由职业者和企业的日常自动化任务
  2. 选择服务器位置(靠近目标受众)
  3. 设置管理员密码 — 安全保存,用于访问 Workspace 界面
  4. 提供 LLM API Key — 支持 Anthropic、OpenAI、OpenRouter、Mistral、Groq、Google 等
  5. 一键部署 — 通过 Hostinger 的 Docker 应用市场

💡 Hostinger 提供 30 天试用期。新用户可用优惠券 GO MSI 享 10% 折扣。

API Key 配置

视频使用 Anthropic 作为 LLM 后端: 1. 前往 Anthropic Console(console.anthropic.com) 2. 创建 API Key(命名为 Hermes) 3. 安全保存 Key,不分享不硬编码 4. 在部署界面填入 Key


分步搭建流程

1. 主 Agent 配置

主 Agent 是你的编排者,用结构化 Prompt 定义其角色。视频中的完整 Prompt 结构:

你是我的 [领域] 团队的首席 Agent 管理者和负责人。

我的背景:
- 我是 [职业],专注于 [主题]
- 定期在 [平台] 发布内容,使用 [语言]
- 使用的工具:[工具列表]

你的任务:
1. 确认连接状态和可用性
   (你收到了我的问题吗?能访问 LLM 吗?能正确回应吗?)
2. 提议 N 个专业子 Agent,包含:
   - Agent 名称
   - 具体职责
   - 主要任务
3. 创建优先级行动计划
   (四个具体的、优先的任务,从今天开始执行)
4. 以结构化、清晰的方式回应
   采取行动,直接了当

核心原则: - 主 Agent 需要理解你的真实业务背景,而非做通用助手 - 给它你的真实个人资料和目标 - 第一步先验证连接 — 确认 LLM 可用后再进入任务

验证连接的 Prompt

请确认你已连接并正常运作:
- 你收到了我的问题
- 你可以访问你的 LLM
- 你能正确回应

2. 创建 Operators

Operators 是专业化的子 Agent,每个需要配置:

字段 说明 示例
名称 标识符(可用 emoji) 🔍 Scout
模型 使用的 LLM Anthropic Claude
描述 专业领域 "AI 领域的竞品情报分析"
任务 Prompt 详细指令 见下方模板

任务 Prompt 模板

角色:[具体角色描述]

监控主题:
- [主题 1]
- [主题 2]
- [主题 3]

目标:
- [应该达成什么]

交付物:
- [期望的输出格式]
- [结果保存位置]

约束:
- [语言、语气、格式要求]

操作流程: 1. 在 Operators 面板点击「添加新 Agent」 2. 填写名称(支持 emoji 作为设计标识) 3. 选择模型(使用已配置的 LLM) 4. 粘贴描述和任务 Prompt 5. 保存 — Agent 即变为可分配状态

最佳实践:让主 Agent 为每个子 Agent 生成优化后的 Prompt。它最了解系统能力,能针对 Workspace 特性定制指令。视频中使用的方式是让主 Agent 先提议 4 个 Agent 的角色、职责和使命,然后直接复制这些建议作为每个 Operator 的配置。

专业化 vs 全能化

❌ 错误做法                    ✅ 正确做法
+-------------------+          +-------------------+
| 1 个通用 Agent     |          | 4 个专家 Agent     |
| 什么都能做         |   →      | 各有专精           |
| 会话越来越长       |          | Agent 创建是免费的 |
| 逐渐失去焦点       |          | 越多专家越好       |
+-------------------+          +-------------------+

关键:会话变长时 Agent 会失去焦点,
专业 Operator 在自己领域内积累深厚专业知识。

3. 任务管理流水线

任务通过看板式流水线流转:

  草稿    →    就绪    →    进行中    →    审核    →    完成
  (Draft)      (Ready)     (In Progress)   (Review)     (Done)
     |                                                      |
     |          +---- 阻塞(需要关注)----+                   |
     +----------→                       ←-------------------+

创建任务时各字段说明:

字段 用途 最佳实践
标题 简短描述 动作导向:「分析 top 5 AI 热门选题」
描述 详细指令 包含目标、背景、期望交付物
优先级 紧急程度 时间敏感任务设为最高
负责人 分配给哪个 Operator 匹配 Agent 专业领域
标签 分类标记 youtubeseoresearch

工作流程: 1. 在草稿栏创建任务(推荐先全放草稿,再批量移至就绪) 2. 准备好后移至就绪 — Agent 即可认领 3. Agent 认领后进入进行中 4. 结果进入审核 5. 通过后标记完成

实际任务描述模板(Scout 竞品分析为例)

目标:分析 YouTube 上 top 5 AI 相关热门选题

背景:我是一名 AI 内容创作者,需要找到最具潜力的视频选题

步骤:
1. 分析 YouTube 上 AI 领域 top 20 频道
2. 生成视频概念和标题
3. 验证选题的可行性
4. 分析最近 5 个视频的跳出点
5. 创建 3 组标题和缩略图变体

交付物:
- Top 5 选题列表(含评分)
- 每个选题的标题建议
- 竞品分析报告

约束:
- 评分范围 0-100
- 聚焦 AI 工具和实际应用

4. 定时调度(Cron)

用定时执行自动化周期性任务:

+---------------------------+
|   定时任务                  |
|                            |
|  [每天 9:00 AM]            |
|  → Scout:研究热门选题      |
|  → Forge:撰写脚本          |
|  → Pulse:优化 SEO          |
|                            |
|  [视频发布后]               |
|  → Bridge:社区互动         |
+---------------------------+

设置流程: 1. 让主 Agent 创建调度系统(Prompt 指令) 2. 定义执行周期(如每天上午 9:00) 3. 指定参与的 Agent 4. 设定任务顺序和依赖 5. Hermes 自动执行剩余部分

调度 Prompt 示例

请创建一个调度系统:
- 每天早上 9:00 准时执行
- 参与的 Agent:Scout、Forge、Pulse
- 确保作为日常工作的一部分持续运行

💡 实际用例:YouTube 创作者可以让 Agent 每天早上研究选题、写脚本、优化 SEO — 起床后直接审阅即可。即使电脑关机,VPS 上的 Agent 仍在工作。

5. 蜂群/任务模式

蜂群模式让主 Agent 自主管理整个工作流:

传统模式(Operators):
  你 → 分配任务给 Agent A → 审核 → 分配给 Agent B → 审核 → ...

蜂群模式(Mission):
  你 → 定义任务 → 主 Agent 自动管理:
    → 拆解为子任务
    → 分配给合适的 Agent
    → 监控进度
    → 处理依赖关系
    → 整合最终结果

启动方式: 1. 进入 Missions 模块 2. 选择 Auto 模式(系统自动匹配 Agent、设置优先级、自动启动) 3. 定义端到端任务 4. 启动 — Hermes 处理编排

任务 Prompt 示例(完整 YouTube 流水线)

创建完整的 YouTube 视频制作流水线:

1. Scout:研究 top 5 AI 热门选题,打分,选出最佳
2. Forge:基于选定选题撰写完整视频脚本
3. Pulse:生成优化的标题、描述、标签、缩略图方案
4. Bridge:制定视频的社区互动策略

所有交付物以整理好的文件返回。

端到端工作流(视频实际演示)

用户 → 主 Agent(创建任务)
            ↓
       主 Agent 拆解任务
            ↓
    +-------+-------+-------+-------+
    ↓       ↓       ↓       ↓       ↓
  Scout   Forge   Pulse   Bridge   (顺序执行)
    ↓       ↓       ↓       ↓
  [选题]  [脚本]  [SEO]   [社区]
    ↓       ↓       ↓       ↓
  交付物  交付物  交付物  交付物
    ↓       ↓       ↓       ↓
    +-------+-------+-------+
            ↓
       最终整合报告

如何让 Agent 间传递工作: 1. Scout 完成后,将结果(选题 + 角度)发送给 Forge 2. Prompt:请将 Scout 的分析结果发送给 Forge,让它基于此撰写脚本 3. Forge 完成后,结果自动流转到 Pulse 4. 每个环节在上一环节交付物的基础上工作

6. 热代理(Autopilot)

热代理是无需对话、自主执行的 Agent:

热代理 vs Operator 的区别:

Operator:  你聊天 → 它回应 → 你引导 → 它执行
热代理:    系统触发 → 它自动执行 → 返回结果

配置热代理的字段

字段 说明 示例
ID 唯一标识符 researcher / writer / reviewer
名称 显示名称 🔍 研究员
模型 使用的 LLM Anthropic Claude(注意不要误选 GPT)
专业领域 简短描述 「进行 AI 主题的深入研究、技术监测、趋势分析」
任务 完整的指令 Prompt 含报告格式、输出位置等
文件权限 输出文件的写入权限 需显式配置

常见热代理类型

+-------------------+     +-------------------+     +-------------------+
|    研究员          |     |     作者           |     |    审核员          |
|                   |     |                   |     |                   |
| - 技术监测         |     | - 脚本撰写         |     | - 质量检查         |
| - 趋势分析         |     | - 内容创作         |     | - 一致性审核       |
| - 来源收集         |     | - 文档编写         |     | - 准确性审查       |
+-------------------+     +-------------------+     +-------------------+

文件权限修复(常见坑)

Docker 容器默认以 root 运行,Workspace 用户无法写入文件。症状:Agent 运行后无法保存输出文件。

# 修复方法:将目录所有者改为 workspace 用户
chown -R workspace:workspace /path/to/output/directory

⚠️ 创建热代理时的避坑: - 模型选择时注意不要误选 GPT(如果 Anthropic 是你的主力模型) - 创建时如果选错模型,点取消重新创建,而非继续 - Agent 创建后显示为「阻塞」是正常的 — 需要先激活(见下方)

激活 Swarm Agent 的方法

蜂群 Agent 在 Docker 容器中运行,默认缺乏执行权限,导致任务显示为「阻塞」。需要通过终端手动激活:

# 在 VPS 终端中执行
# 授予主 Agent 控制其他 Agent 容器的权限
# 具体命令涉及 spamhermes 或类似工具
# 用于在不同 Docker 容器间建立通信

激活流程: 1. 打开 VPS 终端 2. 对每个 Swarm Agent 执行激活命令 3. 或通过新 Session 逐个向 Agent 发送激活 Prompt 4. 激活后任务状态从「阻塞」变为「可执行」


实战案例:4 Agent YouTube 团队

视频演示了一个完整的 YouTube 内容生产团队:

Agent 角色 职责 LLM 任务类型
🔍 Scout(侦察兵) 内容情报 监控趋势、分析 top 20 频道、选题评分(0-100)、输出 top 5 Fuzzy(需要判断和创意)
🔨 Forge(锻造师) 脚本架构 将选题转化为结构化视频脚本、逐段拆解 Fuzzy(创意写作)
📊 Pulse(脉搏) 增长策略 SEO 优化、标题/描述/标签、缩略图 A/B 方案 Fuzzy(优化决策)
🌉 Bridge(桥梁) 社区管理 评论互动、协作请求处理、数据分析 混合(Tool + Fuzzy)

主 Agent 提议的 Agent 名称和使命(来自实际对话):

主 Agent 回应:

✅ 连接已确认。我是你的 YouTube 工作室运营者,准备就绪。

四个专业 Agent 提议:

1. SCOUT(侦察兵)
   角色:内容情报分析师
   使命:监控竞品趋势、热门话题,识别增长机会

2. SCRIPT & STRUCTURE ARCHITECT(脚本与结构架构师)
   角色:Forge
   使命:将复杂概念转化为清晰、有教育性的法语文案

3. AUDIENCE GROWTH STRATEGIST(受众增长策略师)
   角色:Pulse
   使命:分析绩效指标、优化缩略图和标题、识别高点击描述模式

4. BRIDGE(桥梁)
   角色:社区与协作管理者
   使命:互动评论、识别合作机会、处理协作请求

流水线流程:

Scout(研究)      Forge(创作)      Pulse(优化)      Bridge(互动)
     |                  |                   |                   |
[选题发现]  →  [脚本撰写]  →  [SEO 优化]  →  [社区运营]
     |                  |                   |                   |
 Top 5 选题           完整脚本           标题/标签/描述      互动策略
 含评分              逐段拆解           3 组备选方案        效果追踪

Scout 输出示例(视频实际展示)

选题 评分 测试角度 实际角度
AI 视频全流程自动化 92 AI 能完全替代 YouTube 创作吗? 工具 + 实战工作流
Claude vs GPT 对比 88 哪个更好? 分任务类型对比
AI Agent 商业应用 85 它们能做什么? 真实 ROI 案例研究

Scout 的交付物: - Top 5 选题列表(含 0-100 评分) - 每个选题的测试角度(吸引点击的标题角度) - 每个选题的实际角度(视频真正要讲的内容) - 保存为文件,可在 Session 中查看完整报告

Forge 输出示例: - 完整的结构化视频脚本 - 每个段落(Section)的详细内容 - 逐秒的解说词(要说什么、做什么、怎么呈现) - 脚本按时间轴组织,可直接录制

Pulse 输出示例: - 优化后的视频标题(多个变体) - SEO 描述(含关键词) - 标签建议 - 缩略图 A/B 测试方案(3 组)


安全注意事项

风险 缓解措施
Prompt 注入泄露数据 部署在不含个人文件的 VPS 上
API Key 暴露 使用环境变量,绝不硬编码
Agent 权限过大 限制每个 Agent 的文件系统权限
互联网暴露 启用认证、HTTPS、限制网络绑定
Docker 容器逃逸 保持 Docker 更新、使用非 root 用户

安全清单:

✅ VPS 上无个人数据(照片、密码、文档)
✅ API Key 以环境变量存储
✅ Workspace 启用了认证(非公开访问)
✅ 远程访问已启用 HTTPS
✅ 定期更新依赖
✅ Agent 文件权限已最小化(chown -R workspace:workspace)
✅ 防火墙限制了不必要的端口
✅ 30 天试用期内充分测试后再正式使用

三种编排模式对比

                    控制度                   自主性                 复杂度
                    ~~~~~~                   ~~~~~~                 ~~~~~~

Operators:     ████████████░░░░░░     ████░░░░░░░░░░░░░░     ████░░░░░░░░░░░░░░
               你全部分配               Agent 等待指令          容易理解

Swarm:         ██████░░░░░░░░░░░░     ████████████░░░░░░     ██████████░░░░░░░░
               你定义任务               Agent 自我管理          需要+激活

Warm Agents:   ██░░░░░░░░░░░░░░░░     ██████████████████     ██████████████████
               设定一次即可             完全自主运行            文件权限+Docker
选择因素 选 Operators 选 Swarm 选 Warm Agents
需要精细控制
端到端任务
周期性后台任务
多步骤流水线 手动 自动 自动
需要人工审核 始终 起点/终点 从不
搭建复杂度
电脑关机也能跑

核心要点

  1. 专业化胜过全能化 — 创建多个专家 Agent,而非一个通用 Agent。Agent 创建是「免费」的,越多专家越好
  2. VPS 隔离不可妥协 — 永远不要在有个人文件的机器上运行有文件系统访问权限的 AI Agent
  3. 选对编排模式 — Operators 适合精细控制、Swarm 适合复杂任务、Warm Agents 适合定期任务
  4. 结构化 Prompt 是关键 — 为每个 Agent 明确定义角色、目标、交付物和约束
  5. 任务流水线防止混乱 — 草稿 → 就绪 → 进行中 → 审核 → 完成,保持工作有序
  6. 定时调度实现被动生产力 — 设置 Cron 任务,让 Agent 在你睡觉时工作
  7. 文件权限是常见坑 — Docker 容器需要显式的写入权限(chown -R workspace:workspace
  8. Agent 间传递工作 — 上游 Agent 的交付物直接作为下游 Agent 的输入,形成完整流水线
  9. 验证连接再开工 — 第一步先确认 LLM 可用,避免后续排查连接问题

参考资料

相关笔记

  • [[Hermes Agent]]
  • [[Stanford BeyondLM — AI工程师五层技术框架]]
  • [[多智能体系统]]