诚实边界模式¶
诚实边界模式(Honesty Boundary Pattern)是指在构建基于公众人物的 AI 代理或认知框架时,显式定义该模型的能力局限与知识边界的一种设计原则^[001-TODO__nuwa-skill_-_Claude_Code_认知框架提取工具.md]。
该模式强调,一个基于真实人物蒸馏而成的系统必须明确标注其“做不到”的事情,以区分真实的认知能力与模仿出来的表达风格,从而防止过度依赖产生的幻觉或错误推断^[001-TODO__nuwa-skill_-_Claude_Code_认知框架提取工具.md]。
核心特征¶
在 nuwa-skill 的五层模型中,诚实边界位于最底层,构成了整个认知系统的安全阀^[001-TODO__nuwa-skill_-_Claude_Code_认知框架提取工具.md]。它主要界定以下三个方面的局限:
- 无法蒸馏直觉:许多决策基于非显性的直觉或潜意识处理,这部分无法通过语言逻辑或公开资料提取^[001-TODO__nuwa-skill_-_Claude_Code_认知框架提取工具.md]。
- 无法捕捉突变:模型基于历史数据训练,无法预测个人思想的突然转变或未被公开记录的最新决策^[001-TODO__nuwa-skill_-_Claude_Code_认知框架提取工具.md]。
- 表达不等于真实:明确区分“公开表达的观点”与“内心真实想法”之间的差异,避免将公开言论绝对化^[001-TODO__nuwa-skill_-_Claude_Code_认知框架提取工具.md]。
设计原则¶
应用诚实边界模式时,必须承认提取对象的认知黑箱属性[001-TODO__nuwa-skill_-_Claude_Code_认知框架提取工具.md]。该模式通常要求在生成的技能或代理配置文件中包含一个专门的“诚实边界”章节,列出该模型无法回答的问题类型或可能产生不可靠结果的场景[001-TODO__nuwa-skill_-_Claude_Code_认知框架提取工具.md]。
这种设计增加了系统的可信度,因为它管理了用户的预期,避免了将 AI 视为全知全能的先知^[001-TODO__nuwa-skill_-_Claude_Code_认知框架提取工具.md]。
相关概念¶
- [[认知框架提取]]
- [[决策启发式]]
- [[心智模型]]
Sources¶
001-TODO__nuwa-skill_-_Claude_Code_认知框架提取工具.md