Hermes Agent + Claude + Codex — AI Agent 全栈集成指南¶

Julian Goldie 直播内容合集，覆盖 Hermes Agent 与 Codex 的两种集成方式、Claude 作为第二大脑的完整工作流、以及本地模型运行 Computer Use。适合刚接触 AI Agent 协同工作的开发者。

目录¶

#Hermes Agent + Codex 集成
#AI Agent 四层架构
#Claude 作为第二大脑
#本地模型 + Computer Use
#实用技巧速查

Hermes Agent + Codex 集成¶

将 Hermes Agent（自主执行 Agent）与 OpenAI Codex（编码 Agent）结合，实现代码编写 + 自动化部署的全流程。

方式一：Terminal 内嵌运行（简单）¶

直接在 Codex 的终端面板中运行 Hermes Agent：

┌─────────────────────────────────────┐
│           Codex IDE                  │
│  ┌──────────────┐ ┌───────────────┐  │
│  │  代码编辑区   │ │  Terminal     │  │
│  │              │ │  $ hermes     │  │
│  │  Codex 编写  │ │  Hermes 执行  │  │
│  │  前端页面    │ │  部署/任务    │  │
│  └──────────────┘ └───────────────┘  │
└─────────────────────────────────────┘

操作步骤： 1. 在 Codex 中打开项目 2. 点击 Terminal 面板切换终端 3. 直接运行 hermes 命令 4. Hermes 获得项目目录的完整访问权限

适用场景： Codex 写页面 → Hermes 部署到 Netlify 等外部服务

方式二：MCP Server 集成（进阶）¶

将 Hermes Agent 注册为 Codex 的 MCP Server，让 Codex 直接调用 Hermes 的全部工具：

┌─────────────────────────────────────┐
│              Codex                   │
│         ┌───────────┐               │
│         │ Codex LLM │               │
│         └─────┬─────┘               │
│               │ MCP Protocol        │
│         ┌─────▼─────┐               │
│         │ Hermes    │               │
│         │ MCP Server│               │
│         └─────┬─────┘               │
│               │                     │
│    ┌──────────┼──────────┐          │
│    ▼          ▼          ▼          │
│ Terminal    Web         File I/O    │
│ Commands    Requests    Operations  │
└─────────────────────────────────────┘

操作步骤： 1. 在 Codex 中新建项目 2. 将 Hermes MCP 文档（GitHub + 官方文档）粘贴到 Codex 上下文 3. 指示 Codex 将 Hermes 注册为本地 MCP Server 4. Codex 自动验证配置并连接 5. 重启 Codex 后生效

两种方式对比¶

维度	Terminal 内嵌	MCP Server
设置难度	极低（一行命令）	中等（需配置文档）
功能范围	Hermes 独立执行	Codex 直接调用 Hermes 工具
协作模式	串行（各干各的）	深度集成（工具共享）
API 切换	通过 Hermes 配置切换	可混用多个 API
适用场景	快速部署、后台任务	深度自动化、并行 Agent

Claude Desktop 同理¶

同样的 MCP 集成方式适用于 Claude Desktop：Claude 作为"大脑"决策，Hermes 作为"执行者"自主行动。

Claude Desktop (决策/规划)
        │ MCP
        ▼
Hermes Agent (自主执行)

AI Agent 四层架构¶

Julian 提出的 AI Agent 全栈模型：

┌──────────────────────────────────┐
│  Layer 4: Output (自动化产出)     │
│  SEO / 内容 / 部署 / 通知         │
├──────────────────────────────────┤
│  Layer 3: Builder (代码构建)      │
│  Codex / Claude Code              │
├──────────────────────────────────┤
│  Layer 2: Hands (工具连接)        │
│  MCP (Model Context Protocol)     │
├──────────────────────────────────┤
│  Layer 1: Brain (智能决策)        │
│  Hermes Agent / Claude / GPT      │
└──────────────────────────────────┘

各层职责¶

层级	名称	作用	代表工具
1	Brain	接收指令、规划任务、协调工具	Hermes Agent, Claude
2	Hands	AI 与外部工具的通信桥梁	MCP Protocol
3	Builder	读写代码、构建项目	Codex, Claude Code
4	Output	最终自动化产出	Netlify 部署、SEO 内容等

Hermes Agent vs ChatGPT¶

特性	Hermes Agent	ChatGPT
自主性	可自主发送消息、读写文件、部署网站、定时执行	仅回答问题
后台运行	24/7 运行，无需保持窗口打开	需要人工触发
工具集成	通过 MCP 连接任意外部工具	插件生态受限
适用场景	自动化工作流、定时任务、多步操作	问答、写作、分析

判断决策树¶

需要自动化执行任务？
├─ YES → 需要 24/7 后台运行？
│         ├─ YES → Hermes Agent
│         └─ NO → Codex / Claude Code
└─ NO → 只需要问答/分析？
          └─ YES → ChatGPT / Claude Desktop

Claude 作为第二大脑¶

用 OMI + Obsidian + Claude 构建个人知识管理系统。

架构概览¶

┌─────────────────────────────────────────┐
│              数据采集层                   │
│  OMI (屏幕录制 + 对话记录 + 自动笔记)     │
└─────────────────┬───────────────────────┘
                  │ 导出笔记
                  ▼
┌─────────────────────────────────────────┐
│              知识存储层                   │
│  Obsidian Vault (Markdown 文件)          │
│  ┌──────┬──────┬──────┬──────┐          │
│  │Daily │Project│Areas │Archive│         │
│  └──────┴──────┴──────┴──────┘          │
└─────────────────┬───────────────────────┘
                  │ 读取 + 整理
                  ▼
┌─────────────────────────────────────────┐
│              AI 整理层                    │
│  Claude Desktop (打开 Obsidian 目录)     │
│  - 重组 Vault 结构                       │
│  - 创建 Maps of Content                 │
│  - 生成导航索引                          │
└─────────────────┬───────────────────────┘
                  │ 上下文
                  ▼
┌─────────────────────────────────────────┐
│              AI 应用层                    │
│  Hermes Agent / Claude Code / Codex     │
│  读取 Vault 获取用户上下文               │
└─────────────────────────────────────────┘

PAR 方法（Obsidian 组织结构）¶

Claude 将 Obsidian Vault 重组为 PARA 结构（此处为 PAR）：

目录	用途	示例
Daily	每日记录	收件箱、今日待办、记忆
Projects	活跃项目	当前正在推进的事项
Areas	持续关注领域	健身、学习、工作方向
Resources	参考资料	文档、模板、工具清单
Archive	归档	已完成的项目和旧笔记

操作步骤¶

Step 1：设置 OMI - OMI 免费使用（不使用内置聊天功能） - 全天候记录屏幕、对话、任务 - 自动生成记忆和待办

Step 2：导出到 Obsidian - 将 OMI 记忆导出为 Markdown 文件 - 存入 Obsidian Vault

Step 3：Claude 重组 Vault - 在 Claude Desktop 中打开 Obsidian 文件夹 - 指令示例：「基于我的 Obsidian Vault，将其重组为结构化的第二大脑」 - Claude 自动创建 PARA 目录、Maps of Content、导航索引

Step 4：Agent 读取上下文 - Hermes Agent 等工具可读取 Vault 中的 MEMORY.md - 获得用户偏好、项目状态等上下文 - 产出更精准的自动化结果

连接方式¶

方式	操作	优缺点
直接打开文件夹	Claude Desktop → 打开 Obsidian 目录	最简单，但无双向同步
MCP Obsidian 插件	安装 MCP Obsidian 连接 Claude	双向读写，需要配置
Hermes Agent 读取	配置 workdir 指向 Vault	Hermes 可自动引用

最佳实践¶

✅ 让 OMI 持续采集，而非手动记录
✅ 定期让 Claude 重组 Vault（防止混乱堆积）
✅ 在 Vault 中维护 MEMORY.md 供 Agent 读取
✅ 使用 PARA 结构保持长期可维护性
❌ 不要用 Claude 本身作为唯一的笔记存储（它不会主动记录你的日常）
❌ 不要忽略 Vault 的组织，否则 Graph View 混乱不可用

本地模型 + Computer Use¶

在不依赖云 API 的情况下运行 AI Agent 并控制桌面。

工具链¶

组件	作用	说明
Ollama	本地 LLM 运行时	下载并运行本地模型
Claude Code / Codex	编码 Agent	支持切换底层 LLM
CUA Driver	Computer Use 技能	macOS 后台桌面控制

设置流程¶

1. 安装 Ollama
       │
       ▼
2. 下载本地模型
   例: ollama pull qwen3.6
       │
       ▼
3. 启动 Claude Code / Codex（指定本地模型）
   例: ANTHROPIC_BASE_URL=http://localhost:11434 claude
       │
       ▼
4. 配置 CUA Driver
       │
       ▼
5. 使用 Computer Use 指令

代码示例¶

# 1. 安装 Ollama（macOS）
brew install ollama

# 2. 下载模型
ollama pull qwen3.6

# 3. 用本地模型启动 Claude Code
# （需配合 Ollama 的 OpenAI 兼容 API）
ANTHROPIC_BASE_URL=http://localhost:11434/v1 claude

# 4. 使用 CUA Driver 控制 macOS
# 在 Claude Code 中发送：
# "Use CUA driver skill to open Notes application"

Computer Use 的实际效果¶

✅ 能打开 macOS 原生应用（Notes、Safari 等）
✅ 能在后台运行，不抢占用户光标
✅ 能写入文本、导航界面
❌ 操作不够流畅，速度较慢
❌ 复杂交互容易出错
💡 适合简单重复任务，不适合精细操作

硬件要求¶

场景	推荐	可用
高性能本地模型	DGX Spark / 高配工作站	Mac Studio / Mac Mini（仅小模型）
轻量本地模型	Gemma 4 / Qwen 3.6	任意 Mac（性能受限）
云 API 替代	Step 3.5 Flash（免费）	OpenRouter / Nova Portal

实用技巧速查¶

Token 限额绕过¶

Codex 达到 Token 限额时，在 Codex 终端内直接运行 Hermes Agent 继续工作，绕过 Codex 的限额限制。

免费 API 替代¶

Hermes 3.6+ 不再免费时，切换到 Step 3.5 Flash（通过 Nova Portal）作为免费替代：

Hermes Agent 设置 → Nova Portal → 选择 Step 3.5 Flash → 重启

磁盘清理¶

在 Claude Desktop 中直接要求分析磁盘：

"分析我的整个磁盘，找出最佳清理位置，从占用空间最大的开始"

如果分析不够深入，追问：「深入查找占用空间最大的文件」。