Hermes Agent Workspace - 多 Agent 团队搭建实战¶

Hermes Agent Workspace 是 Hermes Agent（Nous Research 出品）的原生 Web UI。它提供了统一的可视化界面来与 Agent 聊天、管理记忆、编辑 Skill、调试执行过程，以及最关键的 — 多 Agent 编排。本笔记覆盖完整工作流：VPS 部署、创建专业子 Agent（Operators）、管理任务流水线、定时调度、以及启动自主蜂群任务。

目录¶

架构概览
VPS 部署
分步搭建流程
1. 主 Agent 配置
2. 创建 Operators
3. 任务管理流水线
4. 定时调度（Cron）
5. 蜂群/任务模式
6. 热代理（Autopilot）
实战案例：4 Agent YouTube 团队
安全注意事项
三种编排模式对比
核心要点
参考资料

架构概览¶

Hermes Workspace 采用层级式 Agent 架构：

+------------------------------------------+
|          主 Agent（编排者）                |
|  - 接收用户指令                            |
|  - 协调子 Agent                            |
|  - 管理任务生命周期                         |
+------------------------------------------+
         |              |              |
    +---------+    +---------+    +---------+
    |Operator A|    |Operator B|    |Operator C|
    |(Scout)   |    |(Forge)   |    |(Pulse)   |
    |研究分析  |    |脚本撰写  |    |SEO 优化   |
    +---------+    +---------+    +---------+

三种编排模式：

模式	工作方式	适用场景
Operators	手动创建子 Agent 并分配任务	需要精细控制的逐步工作流
Swarm/Mission	主 Agent 自动发现 Agent、拆解任务、分配工作	复杂的端到端任务
Warm Agents	自主运行的后台 Agent，无需对话	定期执行的后台任务

VPS 部署¶

为什么用 VPS（而非本地机器）¶

⚠️ 安全第一：AI Agent 拥有文件系统访问权限。Prompt 注入可能导致密码、照片、文件泄露。务必在不含个人数据的 VPS 上隔离运行。 这适用于所有 AI Agent — Hermes、Claude Code、OpenHands 等。

+------------------+     +------------------+
|   本地机器        |     |   VPS (Hostinger)|
|   - 个人数据      |     |   - 仅运行 Hermes |
|   - 密码          |     |   - 无个人文件     |
|   - 照片          |     |                    |
+------------------+     +------------------+

部署步骤¶

选择 Hostinger KVM2 套餐（2 CPU、8 GB RAM）— 适合自由职业者和企业的日常自动化任务
选择服务器位置（靠近目标受众）
设置管理员密码 — 安全保存，用于访问 Workspace 界面
提供 LLM API Key — 支持 Anthropic、OpenAI、OpenRouter、Mistral、Groq、Google 等
一键部署 — 通过 Hostinger 的 Docker 应用市场

💡 Hostinger 提供 30 天试用期。新用户可用优惠券 GO MSI 享 10% 折扣。

API Key 配置¶

视频使用 Anthropic 作为 LLM 后端： 1. 前往 Anthropic Console（console.anthropic.com） 2. 创建 API Key（命名为 Hermes） 3. 安全保存 Key，不分享不硬编码 4. 在部署界面填入 Key

分步搭建流程¶

1. 主 Agent 配置¶

主 Agent 是你的编排者，用结构化 Prompt 定义其角色。视频中的完整 Prompt 结构：

你是我的 [领域] 团队的首席 Agent 管理者和负责人。

我的背景：
- 我是 [职业]，专注于 [主题]
- 定期在 [平台] 发布内容，使用 [语言]
- 使用的工具：[工具列表]

你的任务：
1. 确认连接状态和可用性
   （你收到了我的问题吗？能访问 LLM 吗？能正确回应吗？）
2. 提议 N 个专业子 Agent，包含：
   - Agent 名称
   - 具体职责
   - 主要任务
3. 创建优先级行动计划
   （四个具体的、优先的任务，从今天开始执行）
4. 以结构化、清晰的方式回应
   采取行动，直接了当

核心原则： - 主 Agent 需要理解你的真实业务背景，而非做通用助手 - 给它你的真实个人资料和目标 - 第一步先验证连接 — 确认 LLM 可用后再进入任务

验证连接的 Prompt：

请确认你已连接并正常运作：
- 你收到了我的问题
- 你可以访问你的 LLM
- 你能正确回应

2. 创建 Operators¶

Operators 是专业化的子 Agent，每个需要配置：

字段	说明	示例
名称	标识符（可用 emoji）	🔍 Scout
模型	使用的 LLM	Anthropic Claude
描述	专业领域	"AI 领域的竞品情报分析"
任务 Prompt	详细指令	见下方模板

任务 Prompt 模板：

角色：[具体角色描述]

监控主题：
- [主题 1]
- [主题 2]
- [主题 3]

目标：
- [应该达成什么]

交付物：
- [期望的输出格式]
- [结果保存位置]

约束：
- [语言、语气、格式要求]

操作流程： 1. 在 Operators 面板点击「添加新 Agent」 2. 填写名称（支持 emoji 作为设计标识） 3. 选择模型（使用已配置的 LLM） 4. 粘贴描述和任务 Prompt 5. 保存 — Agent 即变为可分配状态

✅ 最佳实践：让主 Agent 为每个子 Agent 生成优化后的 Prompt。它最了解系统能力，能针对 Workspace 特性定制指令。视频中使用的方式是让主 Agent 先提议 4 个 Agent 的角色、职责和使命，然后直接复制这些建议作为每个 Operator 的配置。

专业化 vs 全能化：

❌ 错误做法                    ✅ 正确做法
+-------------------+          +-------------------+
| 1 个通用 Agent     |          | 4 个专家 Agent     |
| 什么都能做         |   →      | 各有专精           |
| 会话越来越长       |          | Agent 创建是免费的 |
| 逐渐失去焦点       |          | 越多专家越好       |
+-------------------+          +-------------------+

关键：会话变长时 Agent 会失去焦点，
专业 Operator 在自己领域内积累深厚专业知识。

3. 任务管理流水线¶

任务通过看板式流水线流转：

  草稿    →    就绪    →    进行中    →    审核    →    完成
  (Draft)      (Ready)     (In Progress)   (Review)     (Done)
     |                                                      |
     |          +---- 阻塞（需要关注）----+                   |
     +----------→                       ←-------------------+

创建任务时各字段说明：

字段	用途	最佳实践
标题	简短描述	动作导向：「分析 top 5 AI 热门选题」
描述	详细指令	包含目标、背景、期望交付物
优先级	紧急程度	时间敏感任务设为最高
负责人	分配给哪个 Operator	匹配 Agent 专业领域
标签	分类标记	如 `youtube`、`seo`、`research`

工作流程： 1. 在草稿栏创建任务（推荐先全放草稿，再批量移至就绪） 2. 准备好后移至就绪 — Agent 即可认领 3. Agent 认领后进入进行中 4. 结果进入审核 5. 通过后标记完成

实际任务描述模板（Scout 竞品分析为例）：

目标：分析 YouTube 上 top 5 AI 相关热门选题

背景：我是一名 AI 内容创作者，需要找到最具潜力的视频选题

步骤：
1. 分析 YouTube 上 AI 领域 top 20 频道
2. 生成视频概念和标题
3. 验证选题的可行性
4. 分析最近 5 个视频的跳出点
5. 创建 3 组标题和缩略图变体

交付物：
- Top 5 选题列表（含评分）
- 每个选题的标题建议
- 竞品分析报告

约束：
- 评分范围 0-100
- 聚焦 AI 工具和实际应用

4. 定时调度（Cron）¶

用定时执行自动化周期性任务：

+---------------------------+
|   定时任务                  |
|                            |
|  [每天 9:00 AM]            |
|  → Scout：研究热门选题      |
|  → Forge：撰写脚本          |
|  → Pulse：优化 SEO          |
|                            |
|  [视频发布后]               |
|  → Bridge：社区互动         |
+---------------------------+

设置流程： 1. 让主 Agent 创建调度系统（Prompt 指令） 2. 定义执行周期（如每天上午 9:00） 3. 指定参与的 Agent 4. 设定任务顺序和依赖 5. Hermes 自动执行剩余部分

调度 Prompt 示例：

请创建一个调度系统：
- 每天早上 9:00 准时执行
- 参与的 Agent：Scout、Forge、Pulse
- 确保作为日常工作的一部分持续运行

💡 实际用例：YouTube 创作者可以让 Agent 每天早上研究选题、写脚本、优化 SEO — 起床后直接审阅即可。即使电脑关机，VPS 上的 Agent 仍在工作。

5. 蜂群/任务模式¶

蜂群模式让主 Agent 自主管理整个工作流：

传统模式（Operators）：
  你 → 分配任务给 Agent A → 审核 → 分配给 Agent B → 审核 → ...

蜂群模式（Mission）：
  你 → 定义任务 → 主 Agent 自动管理：
    → 拆解为子任务
    → 分配给合适的 Agent
    → 监控进度
    → 处理依赖关系
    → 整合最终结果

启动方式： 1. 进入 Missions 模块 2. 选择 Auto 模式（系统自动匹配 Agent、设置优先级、自动启动） 3. 定义端到端任务 4. 启动 — Hermes 处理编排

任务 Prompt 示例（完整 YouTube 流水线）：

创建完整的 YouTube 视频制作流水线：

1. Scout：研究 top 5 AI 热门选题，打分，选出最佳
2. Forge：基于选定选题撰写完整视频脚本
3. Pulse：生成优化的标题、描述、标签、缩略图方案
4. Bridge：制定视频的社区互动策略

所有交付物以整理好的文件返回。

端到端工作流（视频实际演示）：

用户 → 主 Agent（创建任务）
            ↓
       主 Agent 拆解任务
            ↓
    +-------+-------+-------+-------+
    ↓       ↓       ↓       ↓       ↓
  Scout   Forge   Pulse   Bridge   (顺序执行)
    ↓       ↓       ↓       ↓
  [选题]  [脚本]  [SEO]   [社区]
    ↓       ↓       ↓       ↓
  交付物  交付物  交付物  交付物
    ↓       ↓       ↓       ↓
    +-------+-------+-------+
            ↓
       最终整合报告

如何让 Agent 间传递工作： 1. Scout 完成后，将结果（选题 + 角度）发送给 Forge 2. Prompt：请将 Scout 的分析结果发送给 Forge，让它基于此撰写脚本 3. Forge 完成后，结果自动流转到 Pulse 4. 每个环节在上一环节交付物的基础上工作

6. 热代理（Autopilot）¶

热代理是无需对话、自主执行的 Agent：

热代理 vs Operator 的区别：

Operator：  你聊天 → 它回应 → 你引导 → 它执行
热代理：    系统触发 → 它自动执行 → 返回结果

配置热代理的字段：

字段	说明	示例
ID	唯一标识符	researcher / writer / reviewer
名称	显示名称	🔍 研究员
模型	使用的 LLM	Anthropic Claude（注意不要误选 GPT）
专业领域	简短描述	「进行 AI 主题的深入研究、技术监测、趋势分析」
任务	完整的指令 Prompt	含报告格式、输出位置等
文件权限	输出文件的写入权限	需显式配置

常见热代理类型：

+-------------------+     +-------------------+     +-------------------+
|    研究员          |     |     作者           |     |    审核员          |
|                   |     |                   |     |                   |
| - 技术监测         |     | - 脚本撰写         |     | - 质量检查         |
| - 趋势分析         |     | - 内容创作         |     | - 一致性审核       |
| - 来源收集         |     | - 文档编写         |     | - 准确性审查       |
+-------------------+     +-------------------+     +-------------------+

文件权限修复（常见坑）：

Docker 容器默认以 root 运行，Workspace 用户无法写入文件。症状：Agent 运行后无法保存输出文件。

# 修复方法：将目录所有者改为 workspace 用户
chown -R workspace:workspace /path/to/output/directory

⚠️ 创建热代理时的避坑： - 模型选择时注意不要误选 GPT（如果 Anthropic 是你的主力模型） - 创建时如果选错模型，点取消重新创建，而非继续 - Agent 创建后显示为「阻塞」是正常的 — 需要先激活（见下方）

激活 Swarm Agent 的方法：

蜂群 Agent 在 Docker 容器中运行，默认缺乏执行权限，导致任务显示为「阻塞」。需要通过终端手动激活：

# 在 VPS 终端中执行
# 授予主 Agent 控制其他 Agent 容器的权限
# 具体命令涉及 spamhermes 或类似工具
# 用于在不同 Docker 容器间建立通信

激活流程： 1. 打开 VPS 终端 2. 对每个 Swarm Agent 执行激活命令 3. 或通过新 Session 逐个向 Agent 发送激活 Prompt 4. 激活后任务状态从「阻塞」变为「可执行」

实战案例：4 Agent YouTube 团队¶

视频演示了一个完整的 YouTube 内容生产团队：

Agent	角色	职责	LLM 任务类型
🔍 Scout（侦察兵）	内容情报	监控趋势、分析 top 20 频道、选题评分（0-100）、输出 top 5	Fuzzy（需要判断和创意）
🔨 Forge（锻造师）	脚本架构	将选题转化为结构化视频脚本、逐段拆解	Fuzzy（创意写作）
📊 Pulse（脉搏）	增长策略	SEO 优化、标题/描述/标签、缩略图 A/B 方案	Fuzzy（优化决策）
🌉 Bridge（桥梁）	社区管理	评论互动、协作请求处理、数据分析	混合（Tool + Fuzzy）

主 Agent 提议的 Agent 名称和使命（来自实际对话）：

主 Agent 回应：

✅ 连接已确认。我是你的 YouTube 工作室运营者，准备就绪。

四个专业 Agent 提议：

1. SCOUT（侦察兵）
   角色：内容情报分析师
   使命：监控竞品趋势、热门话题，识别增长机会

2. SCRIPT & STRUCTURE ARCHITECT（脚本与结构架构师）
   角色：Forge
   使命：将复杂概念转化为清晰、有教育性的法语文案

3. AUDIENCE GROWTH STRATEGIST（受众增长策略师）
   角色：Pulse
   使命：分析绩效指标、优化缩略图和标题、识别高点击描述模式

4. BRIDGE（桥梁）
   角色：社区与协作管理者
   使命：互动评论、识别合作机会、处理协作请求

流水线流程：

Scout（研究）      Forge（创作）      Pulse（优化）      Bridge（互动）
     |                  |                   |                   |
[选题发现]  →  [脚本撰写]  →  [SEO 优化]  →  [社区运营]
     |                  |                   |                   |
 Top 5 选题           完整脚本           标题/标签/描述      互动策略
 含评分              逐段拆解           3 组备选方案        效果追踪

Scout 输出示例（视频实际展示）：

选题	评分	测试角度	实际角度
AI 视频全流程自动化	92	AI 能完全替代 YouTube 创作吗？	工具 + 实战工作流
Claude vs GPT 对比	88	哪个更好？	分任务类型对比
AI Agent 商业应用	85	它们能做什么？	真实 ROI 案例研究

Scout 的交付物： - Top 5 选题列表（含 0-100 评分） - 每个选题的测试角度（吸引点击的标题角度） - 每个选题的实际角度（视频真正要讲的内容） - 保存为文件，可在 Session 中查看完整报告

Forge 输出示例： - 完整的结构化视频脚本 - 每个段落（Section）的详细内容 - 逐秒的解说词（要说什么、做什么、怎么呈现） - 脚本按时间轴组织，可直接录制

Pulse 输出示例： - 优化后的视频标题（多个变体） - SEO 描述（含关键词） - 标签建议 - 缩略图 A/B 测试方案（3 组）

安全注意事项¶

风险	缓解措施
Prompt 注入泄露数据	部署在不含个人文件的 VPS 上
API Key 暴露	使用环境变量，绝不硬编码
Agent 权限过大	限制每个 Agent 的文件系统权限
互联网暴露	启用认证、HTTPS、限制网络绑定
Docker 容器逃逸	保持 Docker 更新、使用非 root 用户

安全清单：

✅ VPS 上无个人数据（照片、密码、文档）
✅ API Key 以环境变量存储
✅ Workspace 启用了认证（非公开访问）
✅ 远程访问已启用 HTTPS
✅ 定期更新依赖
✅ Agent 文件权限已最小化（chown -R workspace:workspace）
✅ 防火墙限制了不必要的端口
✅ 30 天试用期内充分测试后再正式使用

三种编排模式对比¶

                    控制度                   自主性                 复杂度
                    ~~~~~~                   ~~~~~~                 ~~~~~~

Operators:     ████████████░░░░░░     ████░░░░░░░░░░░░░░     ████░░░░░░░░░░░░░░
               你全部分配               Agent 等待指令          容易理解

Swarm:         ██████░░░░░░░░░░░░     ████████████░░░░░░     ██████████░░░░░░░░
               你定义任务               Agent 自我管理          需要+激活

Warm Agents:   ██░░░░░░░░░░░░░░░░     ██████████████████     ██████████████████
               设定一次即可             完全自主运行            文件权限+Docker

选择因素	选 Operators	选 Swarm	选 Warm Agents
需要精细控制	✅	❌	❌
端到端任务	❌	✅	❌
周期性后台任务	❌	❌	✅
多步骤流水线	手动	自动	自动
需要人工审核	始终	起点/终点	从不
搭建复杂度	低	中	高
电脑关机也能跑	❌	✅	✅

核心要点¶

专业化胜过全能化 — 创建多个专家 Agent，而非一个通用 Agent。Agent 创建是「免费」的，越多专家越好
VPS 隔离不可妥协 — 永远不要在有个人文件的机器上运行有文件系统访问权限的 AI Agent
选对编排模式 — Operators 适合精细控制、Swarm 适合复杂任务、Warm Agents 适合定期任务
结构化 Prompt 是关键 — 为每个 Agent 明确定义角色、目标、交付物和约束
任务流水线防止混乱 — 草稿 → 就绪 → 进行中 → 审核 → 完成，保持工作有序
定时调度实现被动生产力 — 设置 Cron 任务，让 Agent 在你睡觉时工作
文件权限是常见坑 — Docker 容器需要显式的写入权限（chown -R workspace:workspace）
Agent 间传递工作 — 上游 Agent 的交付物直接作为下游 Agent 的输入，形成完整流水线
验证连接再开工 — 第一步先确认 LLM 可用，避免后续排查连接问题

组件	最低要求	推荐配置
CPU	2 核	2+ 核（KVM）
内存	4 GB	8 GB（日常定时任务必需）
存储	20 GB SSD	40 GB+ SSD
服务商	任意 VPS	Hostinger（一键部署）