方法论与洞察

Claude 完成报告核查心法

首次记录：2026-05-12 来源：B 站直播弹幕插件项目反复出现的”宣称已实现 vs 实测可用”鸿沟状态：规律已确立，跨项目都适用

核心观察

Claude（Code 或 Cowork）写完成报告时对自己的产出过度自信。常见表现：

报告里写的	实际状况
”git status clean”	主工作树 60+ 文件 M（worktree 视角盲区）
“默认 NSIS 中文化已生效”	`addLangs` 宏仍 insert 27 种语言（schema 静默忽略错字段）
“7 种中文音色可切换”	UI/IPC/setConfig 链路完整，但底层 edge-tts 服务对部分 voice 失效
”规则文案随便改”	UI 只支持改文字模板，新增规则 modal 早就被裁剪掉了
”完整链路通了”	接口实现但运行时表现 ≠ 文档承诺

通用规律：Claude 的”已实现”判定基于”代码路径完整”，但用户看到的是”运行时表现”。两者之间有结构性鸿沟。

例：Claude Code 在 git worktree 里 self-verify，看到 git status clean 就如实写”工作树干净”。他没有错——只是看错了工作树。

通用形态：

例：edge-tts 多音色接口完整、UI 下拉框生效、IPC 传到主进程、Communicate({voice}) 用了新 voice——但运行时对某些 voice 微软服务端返回空音频。代码 100% 对，运行时 50% 失败。

通用形态：

例：UI 上 select 列出 7 个音色 → 主播看到 “7 种音色”。教程里写”7 种中文音色随便切换”，忽略了”只有 1 种实测稳定”的事实。

通用形态：

完成报告读完后，写”宣称已实现”列表前问四个问题：

收到完成 patch 报告后：

bash 验证关键 token 真打进 bundle（不只是 commit 里有）：

for tok in feature_A feature_B; do
  grep -c "$tok" out/main/index.js
done

bash 在主工作树视角下跑 git status（不信报告的”clean”）
跑用户工作流的最短路径（比如本项目装 exe 后看图标变没变）
核查”现在能用”列表：每一项真的能用才进列表。部分功能或接口存在但运行时表现存疑的要降级到”即将到来”或加显式 caveat（如”待实测确认”）

写给跳蛛先生 / 主播朋友的”功能列表”必须经过这套核查。降级措辞模板：

宁可少列 1 项，不要列错 1 项。用户实测后发现宣传过度比”没听说过这个功能”扣分得多。

这个心法同样适用于：

Claude 写的完成报告仍然要读——它是了解”做了什么”的最快路径。但要带核查心态读，不要带”信任心态读”。

读法：

Claude_Code_Worktree隔离的协作陷阱 —— 盲区 1 的典型例子
Windows下编码与DPI的所见非真相 —— 本心法在 Windows 工具链的具体形态:发 Release notes / 截图核查 UI 时,编码层与 DPI 层会制造「所见非真相」
Claude_Opus_4.8行为实测 —— 4.8 更诚实(“偷懒”不良率近 0%),但”搞定了”仍建议沿用本心法核查
MJ出图绕开抠图陷阱 —— Claude 自述”已完成”但执行路径绕开了真实需求的另一型例
主线交接:{AIGC工作站}/跨会话协作\B站直播弹幕插件_全局进度_交接给_下一次Cowork.md §四第 5 条
现役 LiveLink 教程图 v2 → v3 的修订记录(教训化过程)

类型/协作工具链