Skip to content

Fable 5 泄露与 AI Agent 架构演进

Anthropic 下一代大模型「Fable 5」的 1,597 行系统提示词从生产仓库泄露, 揭示了一种「单发火枪」设计哲学——放弃外部编排循环,靠强悍基座能力一枪命中。

目录


一、核心事件与背景

事件概要

Anthropic 的下一代大模型底牌「Fable 5」(或称 Mythos 5)的一份 1,597 行、约 120KB 的系统提示词(System Prompt)从生产仓库中泄露。

对业界的影响

过去半年业界使用 LangChain、AutoGPT 或多智能体开会等方式搭建的复杂外挂 Agent 框架,在基座模型足够强悍时,可能瞬间变为累赘。


二、Fable 5 核心技术架构

「單發火槍」工具鏈設計

Fable 5 内置 18 个工具(从命令行到文件操作),但反直觉的是,没有任何一个工具包含代理规划循环或持久化记忆。它不依赖分步或多个 Worker 通信,而是靠超强单核推理一次算出最优解。

傳統多 Agent 架構:
┌──────────┐     ┌──────────┐     ┌──────────┐
│ Planner  │────>│  Worker  │────>│ Critic   │
└──────────┘     └──────────┘     └──────────┘
      │               │               │
      └───────────────>┘<──────────────┘
           多輪循環 / 外部編排器調度

Fable 5 架構:
┌──────────────────────────────────────────┐
│           超強單核推理 + 18 把工具          │
│     一次前向傳播 → 直接產出最終結果        │
└──────────────────────────────────────────┘
           無外部編排 / 無 Agent 循環

Suggest-Confirm 閘門(建议-确认机制)

所有第三方 MCP 应用的调用,必须经过严格的死逻辑:

  1. 查注册表
  2. 强制弹窗将建议扔给用户
  3. 等待用户点头(Approve)才能执行
MCP 調用流程:
工具請求 → 查註冊表 → 生成建議 → 彈窗用戶確認 → 用戶 Approve → 執行
                                    │
                                    └─→ 用戶拒絕 → 中止(幻覺事故歸零)
机制 作用
注册表检查 验证工具合法性
强制弹窗 幻觉引发的灾难性生产事故归零
用户 Approve 人类-in-the-loop 安全网

動態依賴鎖(Scale.md)

在创建任何文件或运行代码前,模型会被强制调用 View 工具读取路径下的 Scale.md。相当于项目中的配置文件,直接告诉大模型「在这个环境只能用这几个库,有 Bug 的别碰」。

核心价值:极致的环境解耦,避免 Prompt 越加越长爆掉 KV Cache。

Claudeception 套娃架构

允许 Claude 在生成的前端应用中通过 Fetch 直接调用自己的 API。基座模型只有一个,但能在几毫秒内动态切换面具:

上一秒:規劃師(生成架構方案)
    │
    │  < 幾毫秒內無縫切換 >
    │
下一秒:審查員(檢查生成代碼質量)

→ 完全不需要外部編排器調度多個 Agent

三、硬性限制与商业权衡

Token 提款機

Fable 5 采取完全无状态的唯读挂载点设计,砍掉了模型的持久化修改能力。为保持对话连贯,外部脚手架必须在每次回车时,将完整的历史、Memory.md、Scale.md 重新回传给上下文窗口。

每次交互成本:
┌─────────────────────────────────────────┐
│ 歷史對話 + Memory.md + Scale.md + ...  │
│            全量重新注入上下文            │
│        ← 商業上的 Token 提款機 →        │
└─────────────────────────────────────────┘

白名單沙盒

Bash 工具虽然强大,但网络配置白名单限制仅能访问 30 多个特定域名。它不是全能的开放世界智能体,而是特定流水线上的高效打孔机。

三大「物理插頭」

限制 具体规则 影响
绝对版权防护 引用单一来源超过 15 个单词即严重违规 模型消耗大量算力重组句子,可能丢失精度
严苛拒绝黑名单 五大类红线(爆炸物、勒索软件等),安全教学也一律拒绝 功能覆盖面被硬切
前端状态存储断崖 严禁在 Artifacts 里使用 localStorage 直接限制复杂 PWA 离线应用的生成

四、AI 路线之争与终局启发

两派对立

派别 代表 核心主张
多智能体外掛循環派 Hermes Agent、LangChain、AutoGPT 用外部编排框架补强基座模型不足
反 Agent 的強基座派 Fable 5 的设计哲学 当模型够强时,外挂框架是累赘

核心观点

Fable 5 证明,当模型把思维链(Chain of Thought)和推理过程以底层算子硬连接吃进模型前向传播时,外部的外挂 Harness 终将被无情撕掉。

AI 架構演進判斷:

基座模型弱 ←────────────────────────────→ 基座模型強
    │                                         │
    ├─ 需要外掛框架(Planner/Critic/Worker)   ├─ 框架存在理由消失
    ├─ 多 Agent 編排有意義                      ├─ 單核推理一槍命中
    │                                         │
    現在大多數團隊在這裡 ──→ 過渡期(補丁時代)

结论:框架存在的根本理由,仅仅是因为基座模型还不够强。


五、核心价值提炼与行动建议

核心哲学

「不講道理的預編譯,勝過一切自作聰明的外掛循環。」

Fable 5 放弃了让 AI 像「多动儿童」一样在外置框架中不断盲目试错,而是透过强悍的基座能力配合严苛的物理边界,追求如「顶尖狙击手」般一枪命中的精准度与安全性。

三個行動建議

  1. 卡点安全设计 — 立刻停止「先做再说」的黑盒异步调用,将「建议-确认」机制像 CI/CD 一样嵌入底层,外部交互必须获得用户明确授权
  2. 拥抱无状态系统 — 精简复杂的跨会话外挂记忆库,改用唯读挂载、白名单沙盒等方式,在每次执行时仅给予大模型最小权限与最干净的运行环境
  3. 勇敢精简架构 — 随时重新审视手头厚重的业务编排框架。当基座模型升级并跨越推理阈值时,要敢于将用来打补丁的 Planner 和 Critic 代码全部删除,轻装上阵

参考资料

相关笔记

  • [[AI Agent 架构设计模式]]