9.8 KiB
9.8 KiB
需求文档|标杆论文逆向工程:从标杆PDF到可复刻写作模板(流程与验收标准)
1. 背景与目标
1.1 背景
用户希望把一篇“标杆MBA论文”当作样板,做系统化逆向工程:
- 抽象出其顶层逻辑结构、论证路线、写作风格;
- 再沉淀成可迁移的写作模板/检查清单,用于写作与评价;
- 未来可复用同一流程去逆向别的标杆论文。
1.2 目标(本流程的最终产出)
将输入的标杆论文(通常为PDF)逆向为一份“可复刻模板”文档,满足:
- 顶层先行:先提炼整体逻辑结构与论证链,再落到章节级模板;
- 可迁移:不依赖论文具体行业/指标,换题目也能用;
- 可执行 + 可评价:既能指导写作(怎么写、写什么),也能评估质量(验收/自评表);
- 定向可配置:可按用户“唯一主线”(如运营)对模板进行定向收束。
1.3 非目标(明确不做什么)
- 不对论文内容做学术真伪审查(除非用户明确要求);
- 不替用户撰写其完整毕业论文(本流程产出模板与方法论);
- 不要求必须复刻原论文主题或研究方法(只抽象可迁移结构)。
2. 适用范围与典型使用场景
2.1 适用范围
- MBA/MPA/应用型硕士论文为主(“问题—分析—对策”范式尤适用);
- 单企业单场景、对策建议型、诊断改进型论文尤适合。
2.2 典型使用场景
- 用户准备开题:需要“可过审”的结构与技术路线写法;
- 用户写作中期:需要对标标杆的“论证闭环”与“章节任务”;
- 用户终稿优化:需要风格、句法、证据链、附录与可复算性的补强清单。
3. 输入、输出与存放规范
3.1 输入(Inputs)
必需:
- 标杆论文文件(推荐PDF,或Word/Markdown)。
可选:
- 用户的写作主线偏好(例如:运营/营销/数字化,只能选一个当唯一主线);
- 研究对象偏好(单企业单场景 vs 多企业对比);
- 用户希望的颗粒度(章节级/段落级/句式库级)。
3.2 工具与约束(关键)
由于部分运行环境对PDF版面读取有限:
- 不得假设“系统Read工具可以直接读PDF”。
- 需要采用文本抽取/转文本方案(例如本地PDF文本提取库/工具)获取正文文本,作为分析依据。
要求:无论使用何种抽取方式,都必须在交付物中标注“分析依据为抽取文本”,并对可能的版面丢失(页眉页脚/图表/公式)给出说明。
3.3 输出(Deliverables)
必需输出文件(放在仓库根目录):
交付物A_标杆论文逆向工程_通用MBA写作模板.md(或同等命名):面向用户写作复用
可选输出文件:
交付物B_标杆论文风格句式库.md(当用户要求句式/段落级时)交付物C_标杆论文图表与附录清单.md(当用户要求证据工程化时)
命名与存放规范:
- 输出文档必须位于项目根目录;
- 文件名应体现“交付物类型 + 主题 + 版本/日期(可选)”。
4. 工作流(从PDF到模板的标准步骤)
本工作流是“可复用流程”,任何新标杆论文均按该步骤执行。
阶段0:需求澄清(必须)
目标:锁定输出形态,避免后期重构。
必问问题(最少确认3项):
- 用户想要:复刻同款还是抽象通用?(默认:抽象通用)
- 用户角色偏好:写作教练 vs 学术评审?(默认:写作教练)
- 分析颗粒度:章节级/段落级/句式级?(默认:章节级)
- 主线:运营/营销/数字化(必须单选,若用户有明确方向则锁死)
- 研究对象:单企业单场景 vs 多企业(必须确认)
产出:
- 一段“确认声明”:本次将以X为主线、Y为对象类型、Z为颗粒度。
验收标准:
- 用户确认不摇摆的主线与对象边界(否则不得进入阶段4/5的定向模板写作)。
阶段1:结构提取(目录与标题层级)(必须)
目标:把论文的目录结构与标题层级抽出来,形成“章节地图”。
执行要点:
- 获取目录页(或通过标题编号模式识别1、1.1、1.1.1等);
- 识别6章法/常见章结构(绪论/理论/对象/分析/对策/结论)。
产出:
- “完整逻辑结构(目录级)”
验收标准:
- 目录能覆盖论文主要章节;
- 能指明“论文核心章”(一般为分析诊断章)。
阶段2:顶层逻辑与论证链提炼(必须,且必须在章节级之前)
目标:抽象出论文的“范式”与“证明路线”。
执行要点(输出必须包含):
- 顶层逻辑范式:例如“提出问题—分析问题—解决问题”的闭环;
- 顶层论证链(9步或同级别链条):背景压力→对象典型性→框架正当性→证问题→定主因→解释原因→对标验证→对策映射→边界收口;
- 一张“骨架图”(用文字或ASCII流程均可)。
验收标准:
- 顶层论证链能解释“为什么第4章结构决定第5章结构”;
- 读者只看顶层部分,就能复述论文是如何被证明出来的。
阶段3:写作风格画像(必须)
目标:提炼标杆论文的“写法”,包括行文风格、句式节奏、论证方式。
执行要点(至少覆盖):
- 行文风格(客观/去主体化/结构化);
- 论证风格(数据驱动/图表三段式/纵横对比/链式归因);
- 句法模板(定义+口径+公式;图表三段式;转折追问;段尾小结)。
验收标准:
- 输出包含可直接替换的句式模板(≥8条);
- 明确“哪些表达会降低标杆感”(口语化、无证据断言、建议不落地等)。
阶段4:章节级模板化(必须)
目标:把“标杆写法”落到每章的职责与产出。
执行要点:
- 逐章给出:章节任务、输入、输出、写作动作、常见雷区;
- 明确“第4章是核心章”,“第4.4病灶清单是第5章目录唯一来源”。
验收标准:
- 用户拿到模板后可直接生成自己的目录(至少二级标题);
- 每章都有“产出物”描述(例如:第4章必须产出主因判定)。
阶段5:补齐“隐藏但关键”的标杆要素(必须,作为质量上限)
目标:提炼用户通常未明确提出、但决定高质量的要素(工程化证据)。
必含要素:
- 可复算性:指标口径表/数据字典/计算链条透明/附录化沉淀;
- 证据三角验证:同一结论≥2类证据(定量+定性互证);
- 参照系设计:对标对象选择原则与口径一致性;
- 病灶—对策映射矩阵:把证据、对策、指标、风险串成表;
- 可实施性:对策写机制、资源、节奏、风险预案;
- 边界管理:明确研究范围与不研究内容。
验收标准:
- 输出文档包含以上6项的可操作检查点与模板表格。
阶段6:定向收束(可配置,若用户明确主线则必须执行)
目标:将模板从“通用”收束为“用户唯一主线”(例如运营)。
执行要点(以运营为例):
- 明确运营为贯穿框架:端到端流程拆解 + 瓶颈/返工归因 + 对标验证;
- 约束营销/数字化:只允许作为输入约束或使能手段,不得抢主因判定;
- 将“决策点”替换为“已锁定主线与对象”,并补齐单场景三边界:场景边界/指标边界/数据边界。
验收标准:
- 文档中不再出现“主线三选一”的摇摆话术;
- 出现“运营主线的核心拆解公式/指标菜单/主因判定清单”。
阶段7:输出交付物写入仓库根目录(必须)
目标:形成稳定可引用的交付文件。
验收标准:
- 文件位于根目录;
- 结构顺序必须为:顶层逻辑 → 风格画像 → 章节模板 → 隐藏关键要素 → 自评表/附录建议。
5. 质量标准(验收口径)
5.1 必须满足(硬性)
- 顶层分析在前,章节级在后;
- 给出可迁移的“论证链条”与“闭环结构”;
- 给出可复刻的句式/段落模板;
- 第4章与第5章的映射关系写清;
- 包含可复算性/三角验证/参照系/映射矩阵/可实施性/边界管理;
- 提供自评检查表。
5.2 加分项(可选)
- 提供图表清单(每章建议1-3张图表及其目的);
- 提供附录模板:指标口径表、访谈提纲、对标对象选择原则;
- 提供“雷区清单”与“如何改写”的示例。
6. 风险与应对
6.1 PDF文本抽取误差
风险:扫描版PDF、图表/公式抽取不全。 应对:
- 标注抽取局限;
- 对关键段落进行多页校验(抽样对照);
- 图表内容用“图表清单 + 文字解释”替代逐项复刻。
6.2 模板过度抽象,落地困难
应对:
- 在章节模板中增加“本章必须产出什么”(可交付物定义);
- 提供运营主线的指标菜单与拆解公式。
6.3 用户主线摇摆导致返工
应对:
- 阶段0强制确认;
- 阶段6定向收束前不得进入大规模模板改写。
7. 变更管理(用于复用时迭代)
当逆向新的标杆论文时,允许在不破坏顶层闭环的情况下扩展:
- 新增一类“标杆要素”(例如:伦理合规、数据安全、项目管理章);
- 将“主线定向”扩展为更多方向(但每次仍需唯一主线)。
建议以版本号迭代本流程:
- v1:闭环诊断型(本需求文档)
- v2:多案例对比型
- v3:设计科学/行动研究型