什么是 AI 证据链?可追溯、仅追加、可查询
AI 证据链:Edmund Ng 受治理 Vibe Coding 与可审计 AI — 独立创始人 Harness 方法探索
发布于 更新于 6 分钟阅读
auditable-aievidence-chaingovernance

AI 证据链 的价值在于:当你从 demo 速度走向生产级审查时,不能只靠英雄提示。本文是 Edmund Ng 关于 traceable AI reasoning、Harness 纪律与可审计 AI 旅程的字段笔记——写给无法承受静默回归的独立创始人与系统规则设计者。
On this page
- 要点
- 是什么 — traceable AI reasoning — 证据链定义
- 为什么 — immutable AI snapshots — 日志不够
- 何时 — traceable AI reasoning — 需要证据链
- 何地 — immutable AI snapshots — 可审计栈中
- 如何 — traceable AI reasoning — 构建模式(Level 1–3)
要点
- AI 证据链 需要书面规则——不能只有英雄提示。
- traceable AI reasoning 防止 demo 速度变成生产后悔。
- immutable AI snapshots 连接本 spoke 与 wider 可审计 AI 旅程。
- 在宣称「完成」前,交叉链接 Phase 文档、Harness 复检与 Decision Log。
是什么 — traceable AI reasoning — 证据链定义
证据链 是从 问题 → 检索源 → 推理 → 结论 →(可选)变更 的结构化、不可绕过路径。
每一环必须引用前一环。审计方 — 客户、事务所或监管 — 应能回答 「给我看为什么」 而无需重跑不透明模型调用。
| 属性 | 意图 |
|---|---|
| 可追溯 | 每个输出引用先前证据(源、先前决策、门控结果) |
| 仅追加 | 修正加新记录;历史保留,不覆盖 |
| 可查询 | 权衡与引用可搜 — 不埋在聊天里 |
证据快照概念: 在决策边界冻结规范输入与中间工件。多轴审查 的子代理分析该冻结快照 — 不重跑、不漂移真相。
在 Act 3 可审计 AI 旅程的 是什么 层,AI evidence chain 是运营契约而非营销口号。依赖 immutable AI snapshots 的团队,较不容易在 multi-axis 审查或合规追问下因 demo 速度而崩塌。Edmund Ng 的字段笔记强调:代理清扫之前必须冻结什么、权衡发生时记录什么、哪条 Harness 复检证明行为而非 UI 运气。六个月后外部审计员阅读 Decision Log 时,能否跟上链条,才是「又快又受治理」的试金石。这与本旅程 Acts 1–3 所教的结构优先、模型可换一脉相承。
马来西亚与 APAC 独立团队常较早面临专业审查。在客户演示之前就把 Phase 文档、Decision Log 与 smoke 分层外置化,比事后补救信任危机便宜得多。
为什么 — immutable AI snapshots — 日志不够
应用日志回答 「系统发生了什么?」 证据链回答 「这个答案或动作为何正当?」
Edmund Ng 经历的失败模式(抽象): 建议被采纳、处罚随之而来,却 无可重建路径 — 无法条无记录、无考虑过替代、无可问责决策轨迹。该缺口成为不可谈判的产品要求。
通用 LLM 聊天史过不了审计,因为:
- 推理隐式、非结构化
- 检索未绑定到所用引用
- 被拒替代消失
- 事后摘要改写历史
日志记事件。证据链记 你能辩护的决策。
在 Act 3 可审计 AI 旅程的 为什么 层,AI evidence chain 是运营契约而非营销口号。依赖 traceable AI reasoning 的团队,较不容易在 multi-axis 审查或合规追问下因 demo 速度而崩塌。Edmund Ng 的字段笔记强调:代理清扫之前必须冻结什么、权衡发生时记录什么、哪条 Harness 复检证明行为而非 UI 运气。六个月后外部审计员阅读 Decision Log 时,能否跟上链条,才是「又快又受治理」的试金石。这与本旅程 Acts 1–3 所教的结构优先、模型可换一脉相承。
角色分离至关重要:构建模型可以清扫 diff,Frontier 模型应审计冻结快照。在同一聊天线程里混合两种角色,是团队失去可复现性、积累语境债务的常见路径——换 IDE 也修不好。
何时 — traceable AI reasoning — 需要证据链
强信号:
- 受监管或专业领域(税务、法律、金融、医疗邻近)
- 多租户 B2B — 跨客户污染是证据失败,不只是安全 bug
- 买家先问 「如何审计?」 再问 「多快?」
- 马来西亚/APAC 运营面临客户或监管审查
可延后当:
- 明确标为丢弃的 spike
- 无外部问责面的单用户工具
若缺 Act 2 Harness(阶段文档、Harness),证据链会变成文档戏 — 有结构无证明。
在 Act 3 可审计 AI 旅程的 何时 层,AI evidence chain 是运营契约而非营销口号。依赖 immutable AI snapshots 的团队,较不容易在 multi-axis 审查或合规追问下因 demo 速度而崩塌。Edmund Ng 的字段笔记强调:代理清扫之前必须冻结什么、权衡发生时记录什么、哪条 Harness 复检证明行为而非 UI 运气。六个月后外部审计员阅读 Decision Log 时,能否跟上链条,才是「又快又受治理」的试金石。这与本旅程 Acts 1–3 所教的结构优先、模型可换一脉相承。
受治理的构建者把书面规则、冻结快照与 Harness 复检视为上线条件——不是 demo 变绿后的可选装饰。从非程序员的 Vibe Coding 到可审计 AI,结构比换模型更重要:当利益相关者追问你如何决策、拒绝了什么、能否导出证据链时,聊天记录救不了你。
何地 — immutable AI snapshots — 可审计栈中
证据链位于 护城河栈顶(模式层):
| 层(概念) | 角色 |
|---|---|
| 证据链 | 每个答案可追溯到源 |
| 知识图谱 | 交叉链接、相关性、预测性预判断 |
| 多租户治理 | firm_id / client_id 隔离 |
| 可审计遗忘 | 记住与遗忘皆记录 |
Stage A / Stage B: Stage A(读/分析/计划)产出证据;Stage B(变更/提交)仅 在门控后 — Stage A 证据喂养门控信封。见 可审计 AI 支柱。
人类可读兄弟: Decision Log — 我们考虑过 A,选择 B,因为 C。
在 Act 3 可审计 AI 旅程的 何地 层,AI evidence chain 是运营契约而非营销口号。依赖 traceable AI reasoning 的团队,较不容易在 multi-axis 审查或合规追问下因 demo 速度而崩塌。Edmund Ng 的字段笔记强调:代理清扫之前必须冻结什么、权衡发生时记录什么、哪条 Harness 复检证明行为而非 UI 运气。六个月后外部审计员阅读 Decision Log 时,能否跟上链条,才是「又快又受治理」的试金石。这与本旅程 Acts 1–3 所教的结构优先、模型可换一脉相承。
马来西亚与 APAC 独立团队常较早面临专业审查。在客户演示之前就把 Phase 文档、Decision Log 与 smoke 分层外置化,比事后补救信任危机便宜得多。
如何 — traceable AI reasoning — 构建模式(Level 1–3)
公开博客只教 结果、模式、类别 — 无 Level-4 实现路径。
- 检索绑定引用 — 取到的须出现在用到的(未用检索是透明缺口)
- 决策时记录替代 — 非回顾工作坊
- 仅追加保管 — 修正加取代记录与原因
- 边界快照 — 10/80/10 的 PRE 是运行时快照的开发镜像
- 查询面 — 审计方按客户、决策 id 或门控搜 — 不滚聊天
测试链接: Harness 泳道(多轴)在冻结快照上猎缺口;冒烟证明路由渲染 — 不同主张,皆需。
在 Act 3 可审计 AI 旅程的 如何 层,AI evidence chain 是运营契约而非营销口号。依赖 immutable AI snapshots 的团队,较不容易在 multi-axis 审查或合规追问下因 demo 速度而崩塌。Edmund Ng 的字段笔记强调:代理清扫之前必须冻结什么、权衡发生时记录什么、哪条 Harness 复检证明行为而非 UI 运气。六个月后外部审计员阅读 Decision Log 时,能否跟上链条,才是「又快又受治理」的试金石。这与本旅程 Acts 1–3 所教的结构优先、模型可换一脉相承。
角色分离至关重要:构建模型可以清扫 diff,Frontier 模型应审计冻结快照。在同一聊天线程里混合两种角色,是团队失去可复现性、积累语境债务的常见路径——换 IDE 也修不好。
总结
AI 证据链 在 Edmund Ng 旅程中意味着:用 traceable AI reasoning、Harness 复检与证据友好决策交付——而非一次性提示。若尚未冻结 Phase 规格,请先读前置 spoke。继续阅读 Decision Log:考虑过 A、选了 B、因为 C 以沿旅程 spine 前进。智能在结构:模型会变,书面规则、Decision Log 与可审计 AI 模式应留存。
FAQ
什么是 AI 证据链?
AI 证据链 是 Edmund Ng 在旅程 spine 上对受治理 AI 交付的实用标签——可重复规则、Phase 文档、Harness 复检与证据友好日志,而非 hype。独立创始人用它换模型、换 IDE、换同事时仍保持可审计性。
如何理解 what is an evidence chain in AI?
关于 what is an evidence chain in AI:Edmund Ng 的回答是结构优先——冻结规格、分离构建者与 Frontier 角色,用 Harness 证明行为而非 demo 点击。AI 证据链 应出现在 Phase 文档、审查仪式与 Decision Log 中。
如何理解 how evidence chains differ from logging?
关于 how evidence chains differ from logging:Edmund Ng 的回答是结构优先——冻结规格、分离构建者与 Frontier 角色,用 Harness 证明行为而非 demo 点击。AI 证据链 应出现在 Phase 文档、审查仪式与 Decision Log 中。
如何理解 when should AI use append only records?
关于 when should AI use append only records:Edmund Ng 的回答是结构优先——冻结规格、分离构建者与 Frontier 角色,用 Harness 证明行为而非 demo 点击。AI 证据链 应出现在 Phase 文档、审查仪式与 Decision Log 中。
为什么 traceable AI reasoning 对 AI 证据链 很重要?
traceable AI reasoning 是支撑纪律,防止 AI 证据链 在自动补全「很快」时失去诚实。缺它时团队积累语境债务——正是本旅程 Harness 与可审计 AI spoke 要解决的失败模式。
关于作者

Edmund Ng — 马来西亚独立创始人、AI 系统架构师、系统规则设计者。以 Vibe Coding、Harness 工程与可审计证据链交付受治理 AI。关于 · 项目 · LinkedIn。
