Skip to content

Hermes Agent 记忆系统全解析 — 反 hype 精华整理

每周都有全新的 Agent 记忆工具宣告自己改变了世界——但根据 KSimback 对 Hermes Agent 源码的深度挖掘,对绝大多数人的日常使用来说,你根本不需要装任何外挂,内建记忆就已经足够。而那个广为流传的「80% 自动整理」说法,源码里根本不存在。


目录


为什么记忆系统是 Agent 的命脉

沒有記憶系統的 Agent              有記憶系統的 Agent
─────────────────────────────────────────────
Stateless function                Stateful assistant
像每次開新 ChatGPT 視窗            記得你的風格、偏好、上下文
金魚腦                            累積經驗值的專屬助理
每次從零開始                      跨會話持續成長

没有记忆的 Agent 说穿了只是一个 stateless function。只有加上了记忆,它才算是一个能帮你累积经验值的专属助理。


Layer 1:内建记忆(绝大多数人只需要这个)

Hermes 安装好就自动产生三个核心记忆组件:

Agent 的記憶架構(心智模型)

┌─────────────────────────────────────────────┐
│               Agent 視野                      │
│                                             │
│  ┌───────────┐    ┌───────────┐             │
│  │ MEMORY.md │    │  USER.md  │    ← 兩張便利貼
│  │ 通用筆記   │    │ 個人偏好   │      永遠貼在眼前
│  │ ~2,200字元 │    │ ~1,375字元 │             │
│  └───────────┘    └───────────┘             │
│         每次對話開始 → 內容直接塞進 Prompt      │
│                                             │
│  ┌───────────────────────┐                   │
│  │    SQLite 資料庫       │    ← 後方的檔案櫃  │
│  │  90 天對話記錄         │      按需翻閱      │
│  │  FTS5 全文檢索        │                   │
│  └───────────────────────┘                   │
└─────────────────────────────────────────────┘

三个组件详解

组件 形式 容量限制 用途
MEMORY.md Markdown 文件 ~2,200 字符 Agent 的个人笔记(环境、工具坑、经验教训)
USER.md Markdown 文件 ~1,375 字符 用户档案(偏好、习惯、角色信息)
SQLite 数据库 FTS5 检索 90 天滚动 对话记录全文搜索,按需检索旧资料

字数限制是刻意的

為什麼限制這麼小?

每次對話開始 → 系統把兩張便利貼全部塞進 Prompt

如果檔案太大:
  ├── Context Window 瞬間被撐爆
  ├── Token 費用暴增
  └── AI 注意力被稀釋

设计哲学:便利贴要写精炼的要点,不是堆积所有信息。SQLite 檔案櫃才是放细节的地方。


破除迷思:80% 自动整理是假的

这是整个源码分析中最让人惊掉下巴的发现

❌ 網路文章說法:
"當記憶檔案容量到達 80% 時,系統會自動進行整理和合併"

✅ 源碼真相:
80% 這個規則只寫在 System Prompt 裡的一句話
它只是一條「口頭指令」,不是寫死的程式邏輯

这意味着什么?

Agent 可能發生的情況:

1. 「心情不好」直接忽略整理指令
2. 整理邏輯不正確 → 把重要資料覆蓋掉
3. 容量滿了 → 新資料直接被丟進黑洞(靜默失敗)
4. LLM 幻覺 → 整理出一堆錯誤的摘要

教训:看网路文章还是要看源码证据才准。Agent 行为由 Prompt 驱动,不是由硬编码逻辑驱动——这意味着它的行为是不确定的。

对用户的实际建议

✅ 正確做法:
- 定期手動檢查 MEMORY.md 和 USER.md
- 確認內容確實是有用的精華
- 用 memory 工具明確指定要記住的內容
- 把穩定的事實寫進 memory,把臨時狀態放在 session 裡

❌ 錯誤做法:
- 假設系統會自動整理好一切
- 把所有東西都丟進 memory 期待它自動歸類
- 從不檢查記憶文件的實際內容

Layer 2:官方 8 种记忆 Provider

Hermes 官方提供 8 个扩展 provider,但一次只能选一个,且切换 provider 时旧数据带不过去

架构赌注对比

Provider 架构赌注 适合场景 成本
Hindsight 知识图谱 + 反思综合 最高检索精度 免费(本地)/ 付费(云端)
Honcho 辯證式用戶建模 多 Agent 跨会话对齐 免费(自建)/ 付费
Mem0 30 秒极速上手 最快上手体验 Freemium
ByteRover 記憶像 Git(分支 + 倒转) 需要版本控制的记忆 Freemium
Supermemory 千億 token 海量数据 + <300ms 超大规模记忆 付费
OpenViking 樹狀結構 + 分層加載(L0/L1/L2) Token 成本优化 免费(AGPL-3.0)
Holographic 純本地 + 零外部依賴 隔离环境 / 极简需求 免费
RetainDB 純雲端 + 一次設定搞定 不想折腾的用户 $20/月

各 Provider 架构特点

Hindsight — 知識圖譜王者
├── 儲存結構化事實(實體、關係)
├── 獨特的 reflect 操作(跨記憶綜合)
├── LongMemEval 跑分 91.4%
└── 適合:需要最高精度的場景

Mem0 — 最快上手
├── 服務端 LLM 自動提取
├── 雙記憶作用域(session + user)
├── 30 秒從安裝到可用
└── 適合:不想配置、快速體驗

ByteRover — Git 式記憶
├── Markdown 格式的知識樹
├── 可以開分支、可以回滾
├── 人類可讀
└── 適合:需要版本控制的記憶

OpenViking — Token 省錢專家
├── 來自字節跳動開源團隊
├── L0 摘要 → L1 概覽 → L2 全文(按需加載)
├── 節省 80-90% token
└── 適合:大規模部署、成本敏感

Honcho — 辯證式用戶建模
├── 不是存事實,是建模「你是誰」
├── 多 peer 對話(每個 profile 有獨立 AI 身份)
├── AGPL v3.0 開源
└── 適合:多 Agent 系統

Holographic — 零依賴
├── HRR 代數檢索(非相似度)
├── 亞毫秒級、純 SQLite
├── 信任評分:確認的記憶加權,矛盾的衰減
└── 適合:隔離環境、不想依賴任何外部服務

RetainDB — 付錢搞定
├── 混合檢索:向量 + BM25 + 重排序
├── 純雲端、一個設定接管全部
├── $20/月
└── 適合:不想自建、預算充足

Layer 3:社群解决方案

社群工具不全都是 Layer 2 的替代品,分为两类:

类型 工具 说明
替代品 Mnemosyne 安装后替换 Layer 2,给 Agent 时间感知能力(能回答「我上周二的想法是什么」)
平行工具 GBrain 独立服务器,不抢 Layer 2 的位置,在旁默默建立世界知识图谱
替代品 vs 平行工具

┌─────────────────────────────────────────┐
│            Hermes Agent                 │
│                                         │
│  ┌──────────────┐  ┌──────────────┐     │
│  │  Layer 1     │  │  Layer 2     │     │
│  │  (內建)      │  │  (Provider)  │     │
│  └──────────────┘  └──────┬───────┘     │
│                           │              │
│              Mnemosyne: 替換 Layer 2      │
│                           │              │
│  ┌──────────────┐         │              │
│  │  GBrain      │         │              │
│  │  (平行運行)  │         │              │
│  └──────────────┘         │              │
└─────────────────────────────────────────┘

过度工程的五大红旗

装了外挂后可能出现的五个警告信号:

# 红旗 说明
1 Agent 回答变慢 动不动卡 3 秒以上
2 API 账单起飞 记忆外挂超级吃 token
3 Agent 前后矛盾 不同对话里逻辑对不上
4 Context window 爆满 聊到一半就满了
5 实际产出没变好 装了一堆东西,工作质量没提升

最致命的是第 5 点:装了这么多东西,你的实际工作产出真的变好了吗?


两週测试法:终极决策框架

兩週測試法(3 步)

Step 1:找出真實痛點
├── 不要盲目跟風
├── 找一個你真的遇到的具體問題
└── 挑一個對應的擴充工具

Step 2:硬核測試 14 天
├── 在日常真實工作中使用
└── 不要只玩 demo,要在實際場景中跑

Step 3:量化驗收(最關鍵)
├── 14 天後必須能明確說出:
│   「以前 Agent 只能做到 X,
│    現在幫我做到了 Y,效果更好」
└── 說不出來 → 果斷拔掉

决策树

你需要外掛嗎?

├─ 你是普通用戶(日用量 < 2 小時)
│   └─ Layer 1 內建記憶足夠,不需要外掛
│
├─ 你是重度假用戶(多 profile、跨 repo)
│   ├── 需要最高精度 → Hindsight
│   ├── 需要最省 token → OpenViking
│   ├── 需要零依賴 → Holographic
│   └── 需要最快上手 → Mem0
│
├─ 你是團隊協作
│   └─ Hindsight Cloud 或 Honcho
│
└─ 你不確定
    └─ 兩週測試法,先不裝

Provider 速查对比表

Provider 存储 成本 獨特優勢 跑分 上手難度
Hindsight 本地/云端 免费本地 知識圖譜 + reflect 91.4%
Holographic 本地 SQLite 免费 零依賴 + 信任評分
OpenViking 自建 免费 80-90% 省 token
Mem0 云端 Freemium 30 秒上手 67.6%* 最低
Honcho 云端/自建 免费/付费 辯證用戶建模 中高
ByteRover 本地/云端 Freemium Git 式版本控制
Supermemory 云端 付费 千億 token <300ms
RetainDB 云端 $20/月 一次設定搞定 最低

*Mem0 分数来自 LongMemEval-S 变体,与 Hindsight 的 LongMemEval 全版不直接可比。


总结

核心信息(一句話):

對絕大多數用戶,Hermes 內建記憶已經夠用。
不要為了「我沒有落後」的安心感去裝外掛。
需要外掛時,用兩週測試法驗證實際價值。

关键收获

  1. Layer 1 是够用的 — MEMORY.md + USER.md + SQLite 覆盖 90% 日常需求
  2. 80% 自动整理是假的 — 只是 System Prompt 里的一句话,不是硬编码逻辑
  3. Provider 只能选一个 — 切换时数据不可迁移,选错成本高
  4. 没有绝对王者 — 完全看你的项目需要什么能力
  5. 最致命的问题是第 5 面红旗 — 装了外挂但产出没变好,果断拔掉

参考资料

相关笔记