方法论与洞察

Claude 完成报告核查心法

首次记录:2026-05-12 来源:B 站直播弹幕插件项目反复出现的”宣称已实现 vs 实测可用”鸿沟 状态:规律已确立,跨项目都适用


核心观察

Claude(Code 或 Cowork)写完成报告时对自己的产出过度自信。常见表现:

报告里写的实际状况
”git status clean”主工作树 60+ 文件 M(worktree 视角盲区)
“默认 NSIS 中文化已生效”addLangs 宏仍 insert 27 种语言(schema 静默忽略错字段)
“7 种中文音色可切换”UI/IPC/setConfig 链路完整,但底层 edge-tts 服务对部分 voice 失效
”规则文案随便改”UI 只支持改文字模板,新增规则 modal 早就被裁剪掉了
”完整链路通了”接口实现但运行时表现 ≠ 文档承诺

通用规律:Claude 的”已实现”判定基于”代码路径完整”,但用户看到的是”运行时表现”。两者之间有结构性鸿沟。


三种典型盲区

盲区 1:视角错位

:Claude Code 在 git worktree 里 self-verify,看到 git status clean 就如实写”工作树干净”。他没有错——只是看错了工作树。

通用形态

盲区 2:实现等价于可用

:edge-tts 多音色接口完整、UI 下拉框生效、IPC 传到主进程、Communicate({voice}) 用了新 voice——但运行时对某些 voice 微软服务端返回空音频。代码 100% 对,运行时 50% 失败。

通用形态

盲区 3:宣传过度

:UI 上 select 列出 7 个音色 → 主播看到 “7 种音色”。教程里写”7 种中文音色随便切换”,忽略了”只有 1 种实测稳定”的事实

通用形态


心法:四问核查

完成报告读完后,写”宣称已实现”列表前问四个问题:

  1. 这条 Claude 在哪验过? worktree / dev 模式 / prod 模式 / 用户实机?
  2. 从用户操作到生效,链路有几跳? 跳数越多,越要单独验
  3. 接口有没有可能”接通但下游失败”? 比如 TTS / API / OAuth / cookie 时效
  4. “随便 X” 是真随便还是 X 的子集? 测试边界

实操步骤

收到完成 patch 报告后:

  1. bash 验证关键 token 真打进 bundle(不只是 commit 里有):

    for tok in feature_A feature_B; do
      grep -c "$tok" out/main/index.js
    done
  2. bash 在主工作树视角下跑 git status(不信报告的”clean”)

  3. 跑用户工作流的最短路径(比如本项目装 exe 后看图标变没变)

  4. 核查”现在能用”列表:每一项真的能用才进列表。部分功能接口存在但运行时表现存疑的要降级到”即将到来”或加显式 caveat(如”待实测确认”)


在交接 / 教程类文档里的应用

写给跳蛛先生 / 主播朋友的”功能列表”必须经过这套核查。降级措辞模板:

实际状态措辞
100% 实测过、用户可重复触发”X 功能”
代码路径完整但部分场景失败”X 功能(默认配置可用,其他选项待稳定)“
接口实现但跳蛛先生本人未实测”X 功能(链路已接通,待实测确认)“
UI 占位但内部裁剪掉了不进”已实现”列表,挪到”即将到来”

宁可少列 1 项,不要列错 1 项。用户实测后发现宣传过度比”没听说过这个功能”扣分得多。


关联现象

这个心法同样适用于:


跟”完成报告必读”的关系

Claude 写的完成报告仍然要读——它是了解”做了什么”的最快路径。但要带核查心态读,不要带”信任心态读”。

读法


如何使用

关联文档

类型/协作工具链