Hermes Agent + Claude + Codex — AI Agent 全栈集成指南¶
Julian Goldie 直播内容合集,覆盖 Hermes Agent 与 Codex 的两种集成方式、Claude 作为第二大脑的完整工作流、以及本地模型运行 Computer Use。适合刚接触 AI Agent 协同工作的开发者。
目录¶
Hermes Agent + Codex 集成¶
将 Hermes Agent(自主执行 Agent)与 OpenAI Codex(编码 Agent)结合,实现代码编写 + 自动化部署的全流程。
方式一:Terminal 内嵌运行(简单)¶
直接在 Codex 的终端面板中运行 Hermes Agent:
┌─────────────────────────────────────┐
│ Codex IDE │
│ ┌──────────────┐ ┌───────────────┐ │
│ │ 代码编辑区 │ │ Terminal │ │
│ │ │ │ $ hermes │ │
│ │ Codex 编写 │ │ Hermes 执行 │ │
│ │ 前端页面 │ │ 部署/任务 │ │
│ └──────────────┘ └───────────────┘ │
└─────────────────────────────────────┘
操作步骤:
1. 在 Codex 中打开项目
2. 点击 Terminal 面板切换终端
3. 直接运行 hermes 命令
4. Hermes 获得项目目录的完整访问权限
适用场景: Codex 写页面 → Hermes 部署到 Netlify 等外部服务
方式二:MCP Server 集成(进阶)¶
将 Hermes Agent 注册为 Codex 的 MCP Server,让 Codex 直接调用 Hermes 的全部工具:
┌─────────────────────────────────────┐
│ Codex │
│ ┌───────────┐ │
│ │ Codex LLM │ │
│ └─────┬─────┘ │
│ │ MCP Protocol │
│ ┌─────▼─────┐ │
│ │ Hermes │ │
│ │ MCP Server│ │
│ └─────┬─────┘ │
│ │ │
│ ┌──────────┼──────────┐ │
│ ▼ ▼ ▼ │
│ Terminal Web File I/O │
│ Commands Requests Operations │
└─────────────────────────────────────┘
操作步骤: 1. 在 Codex 中新建项目 2. 将 Hermes MCP 文档(GitHub + 官方文档)粘贴到 Codex 上下文 3. 指示 Codex 将 Hermes 注册为本地 MCP Server 4. Codex 自动验证配置并连接 5. 重启 Codex 后生效
两种方式对比¶
| 维度 | Terminal 内嵌 | MCP Server |
|---|---|---|
| 设置难度 | 极低(一行命令) | 中等(需配置文档) |
| 功能范围 | Hermes 独立执行 | Codex 直接调用 Hermes 工具 |
| 协作模式 | 串行(各干各的) | 深度集成(工具共享) |
| API 切换 | 通过 Hermes 配置切换 | 可混用多个 API |
| 适用场景 | 快速部署、后台任务 | 深度自动化、并行 Agent |
Claude Desktop 同理¶
同样的 MCP 集成方式适用于 Claude Desktop:Claude 作为"大脑"决策,Hermes 作为"执行者"自主行动。
Claude Desktop (决策/规划)
│ MCP
▼
Hermes Agent (自主执行)
AI Agent 四层架构¶
Julian 提出的 AI Agent 全栈模型:
┌──────────────────────────────────┐
│ Layer 4: Output (自动化产出) │
│ SEO / 内容 / 部署 / 通知 │
├──────────────────────────────────┤
│ Layer 3: Builder (代码构建) │
│ Codex / Claude Code │
├──────────────────────────────────┤
│ Layer 2: Hands (工具连接) │
│ MCP (Model Context Protocol) │
├──────────────────────────────────┤
│ Layer 1: Brain (智能决策) │
│ Hermes Agent / Claude / GPT │
└──────────────────────────────────┘
各层职责¶
| 层级 | 名称 | 作用 | 代表工具 |
|---|---|---|---|
| 1 | Brain | 接收指令、规划任务、协调工具 | Hermes Agent, Claude |
| 2 | Hands | AI 与外部工具的通信桥梁 | MCP Protocol |
| 3 | Builder | 读写代码、构建项目 | Codex, Claude Code |
| 4 | Output | 最终自动化产出 | Netlify 部署、SEO 内容等 |
Hermes Agent vs ChatGPT¶
| 特性 | Hermes Agent | ChatGPT |
|---|---|---|
| 自主性 | 可自主发送消息、读写文件、部署网站、定时执行 | 仅回答问题 |
| 后台运行 | 24/7 运行,无需保持窗口打开 | 需要人工触发 |
| 工具集成 | 通过 MCP 连接任意外部工具 | 插件生态受限 |
| 适用场景 | 自动化工作流、定时任务、多步操作 | 问答、写作、分析 |
判断决策树¶
需要自动化执行任务?
├─ YES → 需要 24/7 后台运行?
│ ├─ YES → Hermes Agent
│ └─ NO → Codex / Claude Code
└─ NO → 只需要问答/分析?
└─ YES → ChatGPT / Claude Desktop
Claude 作为第二大脑¶
用 OMI + Obsidian + Claude 构建个人知识管理系统。
架构概览¶
┌─────────────────────────────────────────┐
│ 数据采集层 │
│ OMI (屏幕录制 + 对话记录 + 自动笔记) │
└─────────────────┬───────────────────────┘
│ 导出笔记
▼
┌─────────────────────────────────────────┐
│ 知识存储层 │
│ Obsidian Vault (Markdown 文件) │
│ ┌──────┬──────┬──────┬──────┐ │
│ │Daily │Project│Areas │Archive│ │
│ └──────┴──────┴──────┴──────┘ │
└─────────────────┬───────────────────────┘
│ 读取 + 整理
▼
┌─────────────────────────────────────────┐
│ AI 整理层 │
│ Claude Desktop (打开 Obsidian 目录) │
│ - 重组 Vault 结构 │
│ - 创建 Maps of Content │
│ - 生成导航索引 │
└─────────────────┬───────────────────────┘
│ 上下文
▼
┌─────────────────────────────────────────┐
│ AI 应用层 │
│ Hermes Agent / Claude Code / Codex │
│ 读取 Vault 获取用户上下文 │
└─────────────────────────────────────────┘
PAR 方法(Obsidian 组织结构)¶
Claude 将 Obsidian Vault 重组为 PARA 结构(此处为 PAR):
| 目录 | 用途 | 示例 |
|---|---|---|
| Daily | 每日记录 | 收件箱、今日待办、记忆 |
| Projects | 活跃项目 | 当前正在推进的事项 |
| Areas | 持续关注领域 | 健身、学习、工作方向 |
| Resources | 参考资料 | 文档、模板、工具清单 |
| Archive | 归档 | 已完成的项目和旧笔记 |
操作步骤¶
Step 1:设置 OMI - OMI 免费使用(不使用内置聊天功能) - 全天候记录屏幕、对话、任务 - 自动生成记忆和待办
Step 2:导出到 Obsidian - 将 OMI 记忆导出为 Markdown 文件 - 存入 Obsidian Vault
Step 3:Claude 重组 Vault - 在 Claude Desktop 中打开 Obsidian 文件夹 - 指令示例:「基于我的 Obsidian Vault,将其重组为结构化的第二大脑」 - Claude 自动创建 PARA 目录、Maps of Content、导航索引
Step 4:Agent 读取上下文
- Hermes Agent 等工具可读取 Vault 中的 MEMORY.md
- 获得用户偏好、项目状态等上下文
- 产出更精准的自动化结果
连接方式¶
| 方式 | 操作 | 优缺点 |
|---|---|---|
| 直接打开文件夹 | Claude Desktop → 打开 Obsidian 目录 | 最简单,但无双向同步 |
| MCP Obsidian 插件 | 安装 MCP Obsidian 连接 Claude | 双向读写,需要配置 |
| Hermes Agent 读取 | 配置 workdir 指向 Vault | Hermes 可自动引用 |
最佳实践¶
- ✅ 让 OMI 持续采集,而非手动记录
- ✅ 定期让 Claude 重组 Vault(防止混乱堆积)
- ✅ 在 Vault 中维护
MEMORY.md供 Agent 读取 - ✅ 使用 PARA 结构保持长期可维护性
- ❌ 不要用 Claude 本身作为唯一的笔记存储(它不会主动记录你的日常)
- ❌ 不要忽略 Vault 的组织,否则 Graph View 混乱不可用
本地模型 + Computer Use¶
在不依赖云 API 的情况下运行 AI Agent 并控制桌面。
工具链¶
| 组件 | 作用 | 说明 |
|---|---|---|
| Ollama | 本地 LLM 运行时 | 下载并运行本地模型 |
| Claude Code / Codex | 编码 Agent | 支持切换底层 LLM |
| CUA Driver | Computer Use 技能 | macOS 后台桌面控制 |
设置流程¶
1. 安装 Ollama
│
▼
2. 下载本地模型
例: ollama pull qwen3.6
│
▼
3. 启动 Claude Code / Codex(指定本地模型)
例: ANTHROPIC_BASE_URL=http://localhost:11434 claude
│
▼
4. 配置 CUA Driver
│
▼
5. 使用 Computer Use 指令
代码示例¶
# 1. 安装 Ollama(macOS)
brew install ollama
# 2. 下载模型
ollama pull qwen3.6
# 3. 用本地模型启动 Claude Code
# (需配合 Ollama 的 OpenAI 兼容 API)
ANTHROPIC_BASE_URL=http://localhost:11434/v1 claude
# 4. 使用 CUA Driver 控制 macOS
# 在 Claude Code 中发送:
# "Use CUA driver skill to open Notes application"
Computer Use 的实际效果¶
- ✅ 能打开 macOS 原生应用(Notes、Safari 等)
- ✅ 能在后台运行,不抢占用户光标
- ✅ 能写入文本、导航界面
- ❌ 操作不够流畅,速度较慢
- ❌ 复杂交互容易出错
- 💡 适合简单重复任务,不适合精细操作
硬件要求¶
| 场景 | 推荐 | 可用 |
|---|---|---|
| 高性能本地模型 | DGX Spark / 高配工作站 | Mac Studio / Mac Mini(仅小模型) |
| 轻量本地模型 | Gemma 4 / Qwen 3.6 | 任意 Mac(性能受限) |
| 云 API 替代 | Step 3.5 Flash(免费) | OpenRouter / Nova Portal |
实用技巧速查¶
Token 限额绕过¶
Codex 达到 Token 限额时,在 Codex 终端内直接运行 Hermes Agent 继续工作,绕过 Codex 的限额限制。
免费 API 替代¶
Hermes 3.6+ 不再免费时,切换到 Step 3.5 Flash(通过 Nova Portal)作为免费替代:
Hermes Agent 设置 → Nova Portal → 选择 Step 3.5 Flash → 重启
磁盘清理¶
在 Claude Desktop 中直接要求分析磁盘:
"分析我的整个磁盘,找出最佳清理位置,从占用空间最大的开始"
如果分析不够深入,追问:「深入查找占用空间最大的文件」。
参考资料¶
相关笔记¶
- [[Hermes Agent 配置与使用]]
- [[MCP 协议详解]]
- [[Obsidian 知识管理]]