Fable 5 泄露与 AI Agent 架构演进¶
Anthropic 下一代大模型「Fable 5」的 1,597 行系统提示词从生产仓库泄露, 揭示了一种「单发火枪」设计哲学——放弃外部编排循环,靠强悍基座能力一枪命中。
目录¶
一、核心事件与背景¶
事件概要¶
Anthropic 的下一代大模型底牌「Fable 5」(或称 Mythos 5)的一份 1,597 行、约 120KB 的系统提示词(System Prompt)从生产仓库中泄露。
对业界的影响¶
过去半年业界使用 LangChain、AutoGPT 或多智能体开会等方式搭建的复杂外挂 Agent 框架,在基座模型足够强悍时,可能瞬间变为累赘。
二、Fable 5 核心技术架构¶
「單發火槍」工具鏈設計¶
Fable 5 内置 18 个工具(从命令行到文件操作),但反直觉的是,没有任何一个工具包含代理规划循环或持久化记忆。它不依赖分步或多个 Worker 通信,而是靠超强单核推理一次算出最优解。
傳統多 Agent 架構:
┌──────────┐ ┌──────────┐ ┌──────────┐
│ Planner │────>│ Worker │────>│ Critic │
└──────────┘ └──────────┘ └──────────┘
│ │ │
└───────────────>┘<──────────────┘
多輪循環 / 外部編排器調度
Fable 5 架構:
┌──────────────────────────────────────────┐
│ 超強單核推理 + 18 把工具 │
│ 一次前向傳播 → 直接產出最終結果 │
└──────────────────────────────────────────┘
無外部編排 / 無 Agent 循環
Suggest-Confirm 閘門(建议-确认机制)¶
所有第三方 MCP 应用的调用,必须经过严格的死逻辑:
- 查注册表
- 强制弹窗将建议扔给用户
- 等待用户点头(Approve)才能执行
MCP 調用流程:
工具請求 → 查註冊表 → 生成建議 → 彈窗用戶確認 → 用戶 Approve → 執行
│
└─→ 用戶拒絕 → 中止(幻覺事故歸零)
| 机制 | 作用 |
|---|---|
| 注册表检查 | 验证工具合法性 |
| 强制弹窗 | 幻觉引发的灾难性生产事故归零 |
| 用户 Approve | 人类-in-the-loop 安全网 |
動態依賴鎖(Scale.md)¶
在创建任何文件或运行代码前,模型会被强制调用 View 工具读取路径下的 Scale.md。相当于项目中的配置文件,直接告诉大模型「在这个环境只能用这几个库,有 Bug 的别碰」。
核心价值:极致的环境解耦,避免 Prompt 越加越长爆掉 KV Cache。
Claudeception 套娃架构¶
允许 Claude 在生成的前端应用中通过 Fetch 直接调用自己的 API。基座模型只有一个,但能在几毫秒内动态切换面具:
上一秒:規劃師(生成架構方案)
│
│ < 幾毫秒內無縫切換 >
│
下一秒:審查員(檢查生成代碼質量)
→ 完全不需要外部編排器調度多個 Agent
三、硬性限制与商业权衡¶
Token 提款機¶
Fable 5 采取完全无状态的唯读挂载点设计,砍掉了模型的持久化修改能力。为保持对话连贯,外部脚手架必须在每次回车时,将完整的历史、Memory.md、Scale.md 重新回传给上下文窗口。
每次交互成本:
┌─────────────────────────────────────────┐
│ 歷史對話 + Memory.md + Scale.md + ... │
│ 全量重新注入上下文 │
│ ← 商業上的 Token 提款機 → │
└─────────────────────────────────────────┘
白名單沙盒¶
Bash 工具虽然强大,但网络配置白名单限制仅能访问 30 多个特定域名。它不是全能的开放世界智能体,而是特定流水线上的高效打孔机。
三大「物理插頭」¶
| 限制 | 具体规则 | 影响 |
|---|---|---|
| 绝对版权防护 | 引用单一来源超过 15 个单词即严重违规 | 模型消耗大量算力重组句子,可能丢失精度 |
| 严苛拒绝黑名单 | 五大类红线(爆炸物、勒索软件等),安全教学也一律拒绝 | 功能覆盖面被硬切 |
| 前端状态存储断崖 | 严禁在 Artifacts 里使用 localStorage |
直接限制复杂 PWA 离线应用的生成 |
四、AI 路线之争与终局启发¶
两派对立¶
| 派别 | 代表 | 核心主张 |
|---|---|---|
| 多智能体外掛循環派 | Hermes Agent、LangChain、AutoGPT | 用外部编排框架补强基座模型不足 |
| 反 Agent 的強基座派 | Fable 5 的设计哲学 | 当模型够强时,外挂框架是累赘 |
核心观点¶
Fable 5 证明,当模型把思维链(Chain of Thought)和推理过程以底层算子硬连接吃进模型前向传播时,外部的外挂 Harness 终将被无情撕掉。
AI 架構演進判斷:
基座模型弱 ←────────────────────────────→ 基座模型強
│ │
├─ 需要外掛框架(Planner/Critic/Worker) ├─ 框架存在理由消失
├─ 多 Agent 編排有意義 ├─ 單核推理一槍命中
│ │
現在大多數團隊在這裡 ──→ 過渡期(補丁時代)
结论:框架存在的根本理由,仅仅是因为基座模型还不够强。
五、核心价值提炼与行动建议¶
核心哲学¶
「不講道理的預編譯,勝過一切自作聰明的外掛循環。」
Fable 5 放弃了让 AI 像「多动儿童」一样在外置框架中不断盲目试错,而是透过强悍的基座能力配合严苛的物理边界,追求如「顶尖狙击手」般一枪命中的精准度与安全性。
三個行動建議¶
- 卡点安全设计 — 立刻停止「先做再说」的黑盒异步调用,将「建议-确认」机制像 CI/CD 一样嵌入底层,外部交互必须获得用户明确授权
- 拥抱无状态系统 — 精简复杂的跨会话外挂记忆库,改用唯读挂载、白名单沙盒等方式,在每次执行时仅给予大模型最小权限与最干净的运行环境
- 勇敢精简架构 — 随时重新审视手头厚重的业务编排框架。当基座模型升级并跨越推理阈值时,要敢于将用来打补丁的 Planner 和 Critic 代码全部删除,轻装上阵
参考资料¶
相关笔记¶
- [[AI Agent 架构设计模式]]