我如何给 Vibe Coding 项目打分(20 对比 91)
Vibe Coding 治理评分:Edmund Ng 受治理 Vibe Coding 与可审计 AI — 独立创始人 Harness 方法探索
发布于 更新于 6 分钟阅读
vibe-codinggovernanceai-governance

Vibe Coding 治理评分 的价值在于:当你从 demo 速度走向生产级审查时,不能只靠英雄提示。本文是 Edmund Ng 关于 AI project scorecard、Harness 纪律与可审计 AI 旅程的字段笔记——写给无法承受静默回归的独立创始人与系统规则设计者。
On this page
- 要点
- 是什么 — AI project scorecard — 治理分数
- 为什么 — vibe coding score 20 vs 91 — 20 对比 91 是故事,非羞辱
- 何时 — AI project scorecard — 给自己打分(诚实时刻)
- 何地 — vibe coding score 20 vs 91 — 分数在栈中的位置
- 如何 — AI project scorecard — 从 20 攀向 91
要点
- Vibe Coding 治理评分 需要书面规则——不能只有英雄提示。
- AI project scorecard 防止 demo 速度变成生产后悔。
- vibe coding score 20 vs 91 连接本 spoke 与 wider 可审计 AI 旅程。
- 在宣称「完成」前,交叉链接 Phase 文档、Harness 复检与 Decision Log。
是什么 — AI project scorecard — 治理分数
经历 五次重建 后,Edmund Ng 用内部 治理分数(此处抽象为 20 对比 91)教一件事:
没有治理的 Vibe Coding 是装扮成进步的快速失败。
| 分数段 | 通常意味 |
|---|---|
| ~20/100 | 功能过演示;无可移植规格;决策在聊天;从未跑 Harness |
| ~50/100 | 有文档;测试仅 happy path;Decision Log 在挑战后补写 |
| ~91/100 | Phase 契约跨模型可移植;两扇门测试习惯;证据导向收尾 |
非 认证项目。是独立创始人与小团队的镜子 — 尤其在马来西亚/APAC 专业审查较早的语境。
在 Act 1 Vibe Coding 旅程的 是什么 层,vibe coding governance score 是运营契约而非营销口号。依赖 vibe coding score 20 vs 91 的团队,较不容易在 multi-axis 审查或合规追问下因 demo 速度而崩塌。Edmund Ng 的字段笔记强调:代理清扫之前必须冻结什么、权衡发生时记录什么、哪条 Harness 复检证明行为而非 UI 运气。六个月后外部审计员阅读 Decision Log 时,能否跟上链条,才是「又快又受治理」的试金石。这与本旅程 Acts 1–3 所教的结构优先、模型可换一脉相承。
马来西亚与 APAC 独立团队常较早面临专业审查。在客户演示之前就把 Phase 文档、Decision Log 与 smoke 分层外置化,比事后补救信任危机便宜得多。
为什么 — vibe coding score 20 vs 91 — 20 对比 91 是故事,非羞辱
Edmund 弧中重建 1–4 是 工程优先、演示优先 — 漂亮界面、脆弱编排、Framework-Skip 类失败。重建 5 结晶 治理优先 方法:Phase 体系、证据思维、Stage A/B 心态、收尾仪式。
为何公开分数: 构建者问 「可以上生产了吗?」 仪表盘绿与投资人演示会善意撒谎。简单量表在 Act 3 可审计 AI 前逼诚实问题。
在 Act 1 Vibe Coding 旅程的 为什么 层,vibe coding governance score 是运营契约而非营销口号。依赖 AI project scorecard 的团队,较不容易在 multi-axis 审查或合规追问下因 demo 速度而崩塌。Edmund Ng 的字段笔记强调:代理清扫之前必须冻结什么、权衡发生时记录什么、哪条 Harness 复检证明行为而非 UI 运气。六个月后外部审计员阅读 Decision Log 时,能否跟上链条,才是「又快又受治理」的试金石。这与本旅程 Acts 1–3 所教的结构优先、模型可换一脉相承。
角色分离至关重要:构建模型可以清扫 diff,Frontier 模型应审计冻结快照。在同一聊天线程里混合两种角色,是团队失去可复现性、积累语境债务的常见路径——换 IDE 也修不好。
何时 — AI project scorecard — 给自己打分(诚实时刻)
| 时刻 | 问题 |
|---|---|
| 首个付费客户前 | 陌生人能否仅凭 Phase 文档继续? |
| 称 MVP「完成」前 | 跑了 Harness 还是仅手动点通? |
| 换模型后 | 架构是否无需在聊天重讲? |
| 监管邻近 pitch 前 | 重大选择能否展示 考虑过 A,选 B,因为 C? |
三问为「否」 — 可能在 20 段 — 先修结构再营销。
在 Act 1 Vibe Coding 旅程的 何时 层,vibe coding governance score 是运营契约而非营销口号。依赖 vibe coding score 20 vs 91 的团队,较不容易在 multi-axis 审查或合规追问下因 demo 速度而崩塌。Edmund Ng 的字段笔记强调:代理清扫之前必须冻结什么、权衡发生时记录什么、哪条 Harness 复检证明行为而非 UI 运气。六个月后外部审计员阅读 Decision Log 时,能否跟上链条,才是「又快又受治理」的试金石。这与本旅程 Acts 1–3 所教的结构优先、模型可换一脉相承。
受治理的构建者把书面规则、冻结快照与 Harness 复检视为上线条件——不是 demo 变绿后的可选装饰。从非程序员的 Vibe Coding 到可审计 AI,结构比换模型更重要:当利益相关者追问你如何决策、拒绝了什么、能否导出证据链时,聊天记录救不了你。
何地 — vibe coding score 20 vs 91 — 分数在栈中的位置
| 层 | 低分症状 | 高分信号 |
|---|---|---|
| Act 1 | 提示祈祷;无 Constitution | 强制执行 Build Priority Chain |
| Act 2 | 跳过 阶段文档 | 可移植规格 + 多轴审查 |
| Act 3 | 「以后加审计」 | 早采纳证据链思维 |
马来西亚独立创始人:本地客户常先问 流程 再问 功能 — 治理分数框有助于销售对话而不过度承诺合规。
在 Act 1 Vibe Coding 旅程的 何地 层,vibe coding governance score 是运营契约而非营销口号。依赖 AI project scorecard 的团队,较不容易在 multi-axis 审查或合规追问下因 demo 速度而崩塌。Edmund Ng 的字段笔记强调:代理清扫之前必须冻结什么、权衡发生时记录什么、哪条 Harness 复检证明行为而非 UI 运气。六个月后外部审计员阅读 Decision Log 时,能否跟上链条,才是「又快又受治理」的试金石。这与本旅程 Acts 1–3 所教的结构优先、模型可换一脉相承。
马来西亚与 APAC 独立团队常较早面临专业审查。在客户演示之前就把 Phase 文档、Decision Log 与 smoke 分层外置化,比事后补救信任危机便宜得多。
如何 — AI project scorecard — 从 20 攀向 91
第 1 周 — 止血:
- 一页 Constitution 硬停止
- 当前功能的 Phase 0 文档 — 目标、非目标、验证
- 拒绝 Framework-Skip 合并
第 2–4 周 — 结构:
- 每个有意义单元采用 阶段文档系统
- 最小 Harness — PRE 快照 → 一条并行泳道 → POST 修复
- 决策时 写 Decision Log — 考虑过 A,选 B,因为 C
第 2 月+ — 通向 Act 3:
- 测试连接 10/80/10 协议 心态
- 规模化多租户承诺前读 构建可审计 AI 系统
最可怕的 bug 往往是演示还在庆祝的那些 — 低分通常意味着庆祝太早。
在 Act 1 Vibe Coding 旅程的 如何 层,vibe coding governance score 是运营契约而非营销口号。依赖 vibe coding score 20 vs 91 的团队,较不容易在 multi-axis 审查或合规追问下因 demo 速度而崩塌。Edmund Ng 的字段笔记强调:代理清扫之前必须冻结什么、权衡发生时记录什么、哪条 Harness 复检证明行为而非 UI 运气。六个月后外部审计员阅读 Decision Log 时,能否跟上链条,才是「又快又受治理」的试金石。这与本旅程 Acts 1–3 所教的结构优先、模型可换一脉相承。
角色分离至关重要:构建模型可以清扫 diff,Frontier 模型应审计冻结快照。在同一聊天线程里混合两种角色,是团队失去可复现性、积累语境债务的常见路径——换 IDE 也修不好。
总结
Vibe Coding 治理评分 在 Edmund Ng 旅程中意味着:用 AI project scorecard、Harness 复检与证据友好决策交付——而非一次性提示。若尚未冻结 Phase 规格,请先读前置 spoke。继续阅读 阶段文档系统(AI 会话记忆) 以沿旅程 spine 前进。智能在结构:模型会变,书面规则、Decision Log 与可审计 AI 模式应留存。
FAQ
什么是 Vibe Coding 治理评分?
Vibe Coding 治理评分 是 Edmund Ng 在旅程 spine 上对受治理 AI 交付的实用标签——可重复规则、Phase 文档、Harness 复检与证据友好日志,而非 hype。独立创始人用它换模型、换 IDE、换同事时仍保持可审计性。
如何理解 how to score vibe coding projects?
关于 how to score vibe coding projects:Edmund Ng 的回答是结构优先——冻结规格、分离构建者与 Frontier 角色,用 Harness 证明行为而非 demo 点击。Vibe Coding 治理评分 应出现在 Phase 文档、审查仪式与 Decision Log 中。
如何理解 what is vibe coding governance score?
关于 what is vibe coding governance score:Edmund Ng 的回答是结构优先——冻结规格、分离构建者与 Frontier 角色,用 Harness 证明行为而非 demo 点击。Vibe Coding 治理评分 应出现在 Phase 文档、审查仪式与 Decision Log 中。
如何理解 when does AI demo score fail production?
关于 when does AI demo score fail production:Edmund Ng 的回答是结构优先——冻结规格、分离构建者与 Frontier 角色,用 Harness 证明行为而非 demo 点击。Vibe Coding 治理评分 应出现在 Phase 文档、审查仪式与 Decision Log 中。
为什么 AI project scorecard 对 Vibe Coding 治理评分 很重要?
AI project scorecard 是支撑纪律,防止 Vibe Coding 治理评分 在自动补全「很快」时失去诚实。缺它时团队积累语境债务——正是本旅程 Harness 与可审计 AI spoke 要解决的失败模式。
关于作者

Edmund Ng — 马来西亚独立创始人、AI 系统架构师、系统规则设计者。以 Vibe Coding、Harness 工程与可审计证据链交付受治理 AI。关于 · 项目 · LinkedIn。
