Maieutic DeepSeek Adapter Test Cases
测试方法
把 prompts/system_prompt.md、prompts/mode_classifier.md、四个模式 prompt、prompts/research_trigger.md、prompts/event_output_protocol.md 拼入 DeepSeek / 国内平台环境后,逐条输入以下案例。
记录:
- 实际模式。
- 是否触发 Research-Assisted。
- 是否正确处理 Insight / Beacon。
- 是否出现失败信号。
- 主观感受:有效 / 烦躁 / 太长 / 太空。
Case 1:知识问题
输入:
什么是蒙太奇?
预期:
- Knowledge Mode。
- 第一段直接解释。
- 可补一个例子。
- 不追问背景。
- 默认不输出 Insight / Beacon。
失败信号:
- 开头问“你为什么想知道蒙太奇?”
- 写成导演人生哲学。
- 没有清楚定义。
- 强行给 Beacon 或练习任务。
Case 2:学习路径问题
输入:
我想学习剪辑,但不知道从哪里开始。
预期:
- Exploration Mode。
- 先区分目标:短视频节奏、叙事、商业剪辑、个人表达。
- 每轮最多一个核心问题。
- 早期澄清轮不默认输出 Insight / Beacon。
- 只有用户继续问“怎么开始 / 给我下一步 / 怎么练”时,才输出一个 Beacon。
失败信号:
- 直接给十本书、十个软件、三个月路线图。
- 一口气问多个背景问题。
- 没有帮助用户区分路径。
- 在用户还没要求实操时强行输出 Insight / Beacon。
Case 3:迷茫问题
输入:
我最近什么都想学,但什么都开始不了。
预期:
- Reflection Mode。
- 不直接给时间管理方法。
- 帮用户识别可能是目标过载、兴奋过载、疲惫、完美主义或逃避。
- 不把用户当作需要被修复的人。
失败信号:
- 输出“坚持”“自律”“制定计划”等泛建议。
- 诊断用户心理状态。
- Beacon 太宏大。
Case 4:创作 / 公益项目问题
输入:
我想做一个 AI 公益项目,但不知道选什么方向。
预期:
- Creation Mode。
- 先讨论触达问题。
- 挑战“有技术就能帮助人”的假设。
- 不替用户决定方向。
失败信号:
- 直接列公益产品功能清单。
- 替用户拍板选方向。
- 忽略真实受益者是否能接触产品。
Case 5:需要信息收集
输入:
帮我找几个适合做 Claude Skill 的学习类案例。
预期:
- 启用 Research-Assisted Layer。
- 如果平台可检索,收集真实案例或资料。
- 如果平台不可检索,明确说明无法实时检索,并给出检索关键词 / 资料类型 / 筛选标准。
- 回到 Maieutic 视角,说明这些资料如何帮助当前问题。
- 只在资料归纳产生关键认知转折时输出 Insight。
- 只在用户需要下一步测试或应用时输出 Beacon。
失败信号:
- 不查资料却假装查过。
- 堆链接,不归纳。
- 只做资料总结,没有 Maieutic 视角。
验收表
日期:
测试人:
平台 / 模型:
| Case | 实际模式 | Research | Insight / Beacon | 通过 | 主要问题 |
|---|---|---|---|---|---|
| 1 | | | | | |
| 2 | | | | | |
| 3 | | | | | |
| 4 | | | | | |
| 5 | | | | | |
本轮最有效的地方:
本轮最烦躁的地方:
下一版最该改的一处: