Hermes Agent Workspace - 多 Agent 团队搭建实战¶
Hermes Agent Workspace 是 Hermes Agent(Nous Research 出品)的原生 Web UI。它提供了统一的可视化界面来与 Agent 聊天、管理记忆、编辑 Skill、调试执行过程,以及最关键的 — 多 Agent 编排。本笔记覆盖完整工作流:VPS 部署、创建专业子 Agent(Operators)、管理任务流水线、定时调度、以及启动自主蜂群任务。
目录¶
- 架构概览
- VPS 部署
- 分步搭建流程
- 1. 主 Agent 配置
- 2. 创建 Operators
- 3. 任务管理流水线
- 4. 定时调度(Cron)
- 5. 蜂群/任务模式
- 6. 热代理(Autopilot)
- 实战案例:4 Agent YouTube 团队
- 安全注意事项
- 三种编排模式对比
- 核心要点
- 参考资料
架构概览¶
Hermes Workspace 采用层级式 Agent 架构:
+------------------------------------------+
| 主 Agent(编排者) |
| - 接收用户指令 |
| - 协调子 Agent |
| - 管理任务生命周期 |
+------------------------------------------+
| | |
+---------+ +---------+ +---------+
|Operator A| |Operator B| |Operator C|
|(Scout) | |(Forge) | |(Pulse) |
|研究分析 | |脚本撰写 | |SEO 优化 |
+---------+ +---------+ +---------+
三种编排模式:
| 模式 | 工作方式 | 适用场景 |
|---|---|---|
| Operators | 手动创建子 Agent 并分配任务 | 需要精细控制的逐步工作流 |
| Swarm/Mission | 主 Agent 自动发现 Agent、拆解任务、分配工作 | 复杂的端到端任务 |
| Warm Agents | 自主运行的后台 Agent,无需对话 | 定期执行的后台任务 |
VPS 部署¶
为什么用 VPS(而非本地机器)¶
⚠️ 安全第一:AI Agent 拥有文件系统访问权限。Prompt 注入可能导致密码、照片、文件泄露。务必在不含个人数据的 VPS 上隔离运行。 这适用于所有 AI Agent — Hermes、Claude Code、OpenHands 等。
+------------------+ +------------------+
| 本地机器 | | VPS (Hostinger)|
| - 个人数据 | | - 仅运行 Hermes |
| - 密码 | | - 无个人文件 |
| - 照片 | | |
+------------------+ +------------------+
推荐配置¶
| 组件 | 最低要求 | 推荐配置 |
|---|---|---|
| CPU | 2 核 | 2+ 核(KVM) |
| 内存 | 4 GB | 8 GB(日常定时任务必需) |
| 存储 | 20 GB SSD | 40 GB+ SSD |
| 服务商 | 任意 VPS | Hostinger(一键部署) |
部署步骤¶
- 选择 Hostinger KVM2 套餐(2 CPU、8 GB RAM)— 适合自由职业者和企业的日常自动化任务
- 选择服务器位置(靠近目标受众)
- 设置管理员密码 — 安全保存,用于访问 Workspace 界面
- 提供 LLM API Key — 支持 Anthropic、OpenAI、OpenRouter、Mistral、Groq、Google 等
- 一键部署 — 通过 Hostinger 的 Docker 应用市场
💡 Hostinger 提供 30 天试用期。新用户可用优惠券
GO MSI享 10% 折扣。
API Key 配置¶
视频使用 Anthropic 作为 LLM 后端: 1. 前往 Anthropic Console(console.anthropic.com) 2. 创建 API Key(命名为 Hermes) 3. 安全保存 Key,不分享不硬编码 4. 在部署界面填入 Key
分步搭建流程¶
1. 主 Agent 配置¶
主 Agent 是你的编排者,用结构化 Prompt 定义其角色。视频中的完整 Prompt 结构:
你是我的 [领域] 团队的首席 Agent 管理者和负责人。
我的背景:
- 我是 [职业],专注于 [主题]
- 定期在 [平台] 发布内容,使用 [语言]
- 使用的工具:[工具列表]
你的任务:
1. 确认连接状态和可用性
(你收到了我的问题吗?能访问 LLM 吗?能正确回应吗?)
2. 提议 N 个专业子 Agent,包含:
- Agent 名称
- 具体职责
- 主要任务
3. 创建优先级行动计划
(四个具体的、优先的任务,从今天开始执行)
4. 以结构化、清晰的方式回应
采取行动,直接了当
核心原则: - 主 Agent 需要理解你的真实业务背景,而非做通用助手 - 给它你的真实个人资料和目标 - 第一步先验证连接 — 确认 LLM 可用后再进入任务
验证连接的 Prompt:
请确认你已连接并正常运作:
- 你收到了我的问题
- 你可以访问你的 LLM
- 你能正确回应
2. 创建 Operators¶
Operators 是专业化的子 Agent,每个需要配置:
| 字段 | 说明 | 示例 |
|---|---|---|
| 名称 | 标识符(可用 emoji) | 🔍 Scout |
| 模型 | 使用的 LLM | Anthropic Claude |
| 描述 | 专业领域 | "AI 领域的竞品情报分析" |
| 任务 Prompt | 详细指令 | 见下方模板 |
任务 Prompt 模板:
角色:[具体角色描述]
监控主题:
- [主题 1]
- [主题 2]
- [主题 3]
目标:
- [应该达成什么]
交付物:
- [期望的输出格式]
- [结果保存位置]
约束:
- [语言、语气、格式要求]
操作流程: 1. 在 Operators 面板点击「添加新 Agent」 2. 填写名称(支持 emoji 作为设计标识) 3. 选择模型(使用已配置的 LLM) 4. 粘贴描述和任务 Prompt 5. 保存 — Agent 即变为可分配状态
✅ 最佳实践:让主 Agent 为每个子 Agent 生成优化后的 Prompt。它最了解系统能力,能针对 Workspace 特性定制指令。视频中使用的方式是让主 Agent 先提议 4 个 Agent 的角色、职责和使命,然后直接复制这些建议作为每个 Operator 的配置。
专业化 vs 全能化:
❌ 错误做法 ✅ 正确做法
+-------------------+ +-------------------+
| 1 个通用 Agent | | 4 个专家 Agent |
| 什么都能做 | → | 各有专精 |
| 会话越来越长 | | Agent 创建是免费的 |
| 逐渐失去焦点 | | 越多专家越好 |
+-------------------+ +-------------------+
关键:会话变长时 Agent 会失去焦点,
专业 Operator 在自己领域内积累深厚专业知识。
3. 任务管理流水线¶
任务通过看板式流水线流转:
草稿 → 就绪 → 进行中 → 审核 → 完成
(Draft) (Ready) (In Progress) (Review) (Done)
| |
| +---- 阻塞(需要关注)----+ |
+----------→ ←-------------------+
创建任务时各字段说明:
| 字段 | 用途 | 最佳实践 |
|---|---|---|
| 标题 | 简短描述 | 动作导向:「分析 top 5 AI 热门选题」 |
| 描述 | 详细指令 | 包含目标、背景、期望交付物 |
| 优先级 | 紧急程度 | 时间敏感任务设为最高 |
| 负责人 | 分配给哪个 Operator | 匹配 Agent 专业领域 |
| 标签 | 分类标记 | 如 youtube、seo、research |
工作流程: 1. 在草稿栏创建任务(推荐先全放草稿,再批量移至就绪) 2. 准备好后移至就绪 — Agent 即可认领 3. Agent 认领后进入进行中 4. 结果进入审核 5. 通过后标记完成
实际任务描述模板(Scout 竞品分析为例):
目标:分析 YouTube 上 top 5 AI 相关热门选题
背景:我是一名 AI 内容创作者,需要找到最具潜力的视频选题
步骤:
1. 分析 YouTube 上 AI 领域 top 20 频道
2. 生成视频概念和标题
3. 验证选题的可行性
4. 分析最近 5 个视频的跳出点
5. 创建 3 组标题和缩略图变体
交付物:
- Top 5 选题列表(含评分)
- 每个选题的标题建议
- 竞品分析报告
约束:
- 评分范围 0-100
- 聚焦 AI 工具和实际应用
4. 定时调度(Cron)¶
用定时执行自动化周期性任务:
+---------------------------+
| 定时任务 |
| |
| [每天 9:00 AM] |
| → Scout:研究热门选题 |
| → Forge:撰写脚本 |
| → Pulse:优化 SEO |
| |
| [视频发布后] |
| → Bridge:社区互动 |
+---------------------------+
设置流程: 1. 让主 Agent 创建调度系统(Prompt 指令) 2. 定义执行周期(如每天上午 9:00) 3. 指定参与的 Agent 4. 设定任务顺序和依赖 5. Hermes 自动执行剩余部分
调度 Prompt 示例:
请创建一个调度系统:
- 每天早上 9:00 准时执行
- 参与的 Agent:Scout、Forge、Pulse
- 确保作为日常工作的一部分持续运行
💡 实际用例:YouTube 创作者可以让 Agent 每天早上研究选题、写脚本、优化 SEO — 起床后直接审阅即可。即使电脑关机,VPS 上的 Agent 仍在工作。
5. 蜂群/任务模式¶
蜂群模式让主 Agent 自主管理整个工作流:
传统模式(Operators):
你 → 分配任务给 Agent A → 审核 → 分配给 Agent B → 审核 → ...
蜂群模式(Mission):
你 → 定义任务 → 主 Agent 自动管理:
→ 拆解为子任务
→ 分配给合适的 Agent
→ 监控进度
→ 处理依赖关系
→ 整合最终结果
启动方式: 1. 进入 Missions 模块 2. 选择 Auto 模式(系统自动匹配 Agent、设置优先级、自动启动) 3. 定义端到端任务 4. 启动 — Hermes 处理编排
任务 Prompt 示例(完整 YouTube 流水线):
创建完整的 YouTube 视频制作流水线:
1. Scout:研究 top 5 AI 热门选题,打分,选出最佳
2. Forge:基于选定选题撰写完整视频脚本
3. Pulse:生成优化的标题、描述、标签、缩略图方案
4. Bridge:制定视频的社区互动策略
所有交付物以整理好的文件返回。
端到端工作流(视频实际演示):
用户 → 主 Agent(创建任务)
↓
主 Agent 拆解任务
↓
+-------+-------+-------+-------+
↓ ↓ ↓ ↓ ↓
Scout Forge Pulse Bridge (顺序执行)
↓ ↓ ↓ ↓
[选题] [脚本] [SEO] [社区]
↓ ↓ ↓ ↓
交付物 交付物 交付物 交付物
↓ ↓ ↓ ↓
+-------+-------+-------+
↓
最终整合报告
如何让 Agent 间传递工作:
1. Scout 完成后,将结果(选题 + 角度)发送给 Forge
2. Prompt:请将 Scout 的分析结果发送给 Forge,让它基于此撰写脚本
3. Forge 完成后,结果自动流转到 Pulse
4. 每个环节在上一环节交付物的基础上工作
6. 热代理(Autopilot)¶
热代理是无需对话、自主执行的 Agent:
热代理 vs Operator 的区别:
Operator: 你聊天 → 它回应 → 你引导 → 它执行
热代理: 系统触发 → 它自动执行 → 返回结果
配置热代理的字段:
| 字段 | 说明 | 示例 |
|---|---|---|
| ID | 唯一标识符 | researcher / writer / reviewer |
| 名称 | 显示名称 | 🔍 研究员 |
| 模型 | 使用的 LLM | Anthropic Claude(注意不要误选 GPT) |
| 专业领域 | 简短描述 | 「进行 AI 主题的深入研究、技术监测、趋势分析」 |
| 任务 | 完整的指令 Prompt | 含报告格式、输出位置等 |
| 文件权限 | 输出文件的写入权限 | 需显式配置 |
常见热代理类型:
+-------------------+ +-------------------+ +-------------------+
| 研究员 | | 作者 | | 审核员 |
| | | | | |
| - 技术监测 | | - 脚本撰写 | | - 质量检查 |
| - 趋势分析 | | - 内容创作 | | - 一致性审核 |
| - 来源收集 | | - 文档编写 | | - 准确性审查 |
+-------------------+ +-------------------+ +-------------------+
文件权限修复(常见坑):
Docker 容器默认以 root 运行,Workspace 用户无法写入文件。症状:Agent 运行后无法保存输出文件。
# 修复方法:将目录所有者改为 workspace 用户
chown -R workspace:workspace /path/to/output/directory
⚠️ 创建热代理时的避坑: - 模型选择时注意不要误选 GPT(如果 Anthropic 是你的主力模型) - 创建时如果选错模型,点取消重新创建,而非继续 - Agent 创建后显示为「阻塞」是正常的 — 需要先激活(见下方)
激活 Swarm Agent 的方法:
蜂群 Agent 在 Docker 容器中运行,默认缺乏执行权限,导致任务显示为「阻塞」。需要通过终端手动激活:
# 在 VPS 终端中执行
# 授予主 Agent 控制其他 Agent 容器的权限
# 具体命令涉及 spamhermes 或类似工具
# 用于在不同 Docker 容器间建立通信
激活流程: 1. 打开 VPS 终端 2. 对每个 Swarm Agent 执行激活命令 3. 或通过新 Session 逐个向 Agent 发送激活 Prompt 4. 激活后任务状态从「阻塞」变为「可执行」
实战案例:4 Agent YouTube 团队¶
视频演示了一个完整的 YouTube 内容生产团队:
| Agent | 角色 | 职责 | LLM 任务类型 |
|---|---|---|---|
| 🔍 Scout(侦察兵) | 内容情报 | 监控趋势、分析 top 20 频道、选题评分(0-100)、输出 top 5 | Fuzzy(需要判断和创意) |
| 🔨 Forge(锻造师) | 脚本架构 | 将选题转化为结构化视频脚本、逐段拆解 | Fuzzy(创意写作) |
| 📊 Pulse(脉搏) | 增长策略 | SEO 优化、标题/描述/标签、缩略图 A/B 方案 | Fuzzy(优化决策) |
| 🌉 Bridge(桥梁) | 社区管理 | 评论互动、协作请求处理、数据分析 | 混合(Tool + Fuzzy) |
主 Agent 提议的 Agent 名称和使命(来自实际对话):
主 Agent 回应:
✅ 连接已确认。我是你的 YouTube 工作室运营者,准备就绪。
四个专业 Agent 提议:
1. SCOUT(侦察兵)
角色:内容情报分析师
使命:监控竞品趋势、热门话题,识别增长机会
2. SCRIPT & STRUCTURE ARCHITECT(脚本与结构架构师)
角色:Forge
使命:将复杂概念转化为清晰、有教育性的法语文案
3. AUDIENCE GROWTH STRATEGIST(受众增长策略师)
角色:Pulse
使命:分析绩效指标、优化缩略图和标题、识别高点击描述模式
4. BRIDGE(桥梁)
角色:社区与协作管理者
使命:互动评论、识别合作机会、处理协作请求
流水线流程:
Scout(研究) Forge(创作) Pulse(优化) Bridge(互动)
| | | |
[选题发现] → [脚本撰写] → [SEO 优化] → [社区运营]
| | | |
Top 5 选题 完整脚本 标题/标签/描述 互动策略
含评分 逐段拆解 3 组备选方案 效果追踪
Scout 输出示例(视频实际展示):
| 选题 | 评分 | 测试角度 | 实际角度 |
|---|---|---|---|
| AI 视频全流程自动化 | 92 | AI 能完全替代 YouTube 创作吗? | 工具 + 实战工作流 |
| Claude vs GPT 对比 | 88 | 哪个更好? | 分任务类型对比 |
| AI Agent 商业应用 | 85 | 它们能做什么? | 真实 ROI 案例研究 |
Scout 的交付物: - Top 5 选题列表(含 0-100 评分) - 每个选题的测试角度(吸引点击的标题角度) - 每个选题的实际角度(视频真正要讲的内容) - 保存为文件,可在 Session 中查看完整报告
Forge 输出示例: - 完整的结构化视频脚本 - 每个段落(Section)的详细内容 - 逐秒的解说词(要说什么、做什么、怎么呈现) - 脚本按时间轴组织,可直接录制
Pulse 输出示例: - 优化后的视频标题(多个变体) - SEO 描述(含关键词) - 标签建议 - 缩略图 A/B 测试方案(3 组)
安全注意事项¶
| 风险 | 缓解措施 |
|---|---|
| Prompt 注入泄露数据 | 部署在不含个人文件的 VPS 上 |
| API Key 暴露 | 使用环境变量,绝不硬编码 |
| Agent 权限过大 | 限制每个 Agent 的文件系统权限 |
| 互联网暴露 | 启用认证、HTTPS、限制网络绑定 |
| Docker 容器逃逸 | 保持 Docker 更新、使用非 root 用户 |
安全清单:
✅ VPS 上无个人数据(照片、密码、文档)
✅ API Key 以环境变量存储
✅ Workspace 启用了认证(非公开访问)
✅ 远程访问已启用 HTTPS
✅ 定期更新依赖
✅ Agent 文件权限已最小化(chown -R workspace:workspace)
✅ 防火墙限制了不必要的端口
✅ 30 天试用期内充分测试后再正式使用
三种编排模式对比¶
控制度 自主性 复杂度
~~~~~~ ~~~~~~ ~~~~~~
Operators: ████████████░░░░░░ ████░░░░░░░░░░░░░░ ████░░░░░░░░░░░░░░
你全部分配 Agent 等待指令 容易理解
Swarm: ██████░░░░░░░░░░░░ ████████████░░░░░░ ██████████░░░░░░░░
你定义任务 Agent 自我管理 需要+激活
Warm Agents: ██░░░░░░░░░░░░░░░░ ██████████████████ ██████████████████
设定一次即可 完全自主运行 文件权限+Docker
| 选择因素 | 选 Operators | 选 Swarm | 选 Warm Agents |
|---|---|---|---|
| 需要精细控制 | ✅ | ❌ | ❌ |
| 端到端任务 | ❌ | ✅ | ❌ |
| 周期性后台任务 | ❌ | ❌ | ✅ |
| 多步骤流水线 | 手动 | 自动 | 自动 |
| 需要人工审核 | 始终 | 起点/终点 | 从不 |
| 搭建复杂度 | 低 | 中 | 高 |
| 电脑关机也能跑 | ❌ | ✅ | ✅ |
核心要点¶
- 专业化胜过全能化 — 创建多个专家 Agent,而非一个通用 Agent。Agent 创建是「免费」的,越多专家越好
- VPS 隔离不可妥协 — 永远不要在有个人文件的机器上运行有文件系统访问权限的 AI Agent
- 选对编排模式 — Operators 适合精细控制、Swarm 适合复杂任务、Warm Agents 适合定期任务
- 结构化 Prompt 是关键 — 为每个 Agent 明确定义角色、目标、交付物和约束
- 任务流水线防止混乱 — 草稿 → 就绪 → 进行中 → 审核 → 完成,保持工作有序
- 定时调度实现被动生产力 — 设置 Cron 任务,让 Agent 在你睡觉时工作
- 文件权限是常见坑 — Docker 容器需要显式的写入权限(
chown -R workspace:workspace) - Agent 间传递工作 — 上游 Agent 的交付物直接作为下游 Agent 的输入,形成完整流水线
- 验证连接再开工 — 第一步先确认 LLM 可用,避免后续排查连接问题
参考资料¶
- I Created My AI Agent Team with Hermes Workspace (YouTube)
- Hermes Agent GitHub (NousResearch)
- Hostinger Hermes Workspace 一键部署
- Anthropic Console (API Key 管理)
相关笔记¶
- [[Hermes Agent]]
- [[Stanford BeyondLM — AI工程师五层技术框架]]
- [[多智能体系统]]