目标:把“会写”升级为“写得准”。
适用:长文、教程、新闻解读、观点类文章。
你将获得:流程方法、提示词模板、证据表格、图表与术语规范、上线前终极清单。
目录
为什么模型会“胡说”(幻觉)?
- 概率补全而非事实回忆:大模型优化的是“更可能的下一句”,不是“更真实的下一句”。
- 时间与版本错配:对价格、版本号、规则等信息尤其敏感,容易过期或混淆上下文。
- 长链推理放大误差:多前提串联,任一环节错误都会被放大。
- 引用漂移:写作后期替换句子/顺序,导致证据与断言错位。
解决思路:把“真实性”做成流程件 —— 证据先行、结构内嵌、标注统一、上线自检。
六条核心原则
- 证据优先:先建“证据盒”,后动笔。
- 原子化断言:将结论拆成可独立核对的最小片段(MVCF)。
- 边界明确:每个观点都说明适用条件与不适用情形。
- 来源分级:官方/一手 > 权威机构 > 主流媒体 > 个人博客/社媒。
- 可复核:全文可一键回溯到原文片段与出处。
- 透明修订:对外公示变更记录(版本号或要点),减少读者不确定感。
四道防线总览
- 选题:先列“可被打脸”的事实清单(MVCF)。
- 资料:证据表结构化存放,标注来源、摘要、可信度,必要时记录获取时间。
- 写作:段落采用“论点—证据—解释—限制条件”,强制内联引用。
- 发布:机器自检 + 人工抽检 + 链接有效性 + 风险提示。
1)选题阶段:把“可核查事实”提前列出来
目标:在写第一句之前,明确本文承诺输出的“可核查事实”。
模板:选题 → 声明清单
[文章标题草案]:
核心结论(1 句):
读者会据此做出的行动(1 句):
MVCF 列表(每条 <= 25 字):
- 事实1:
- 事实2:
- 事实3:
适用范围与例外:
- 适用:
- 不适用:
选题三问:
- 这篇文章要改变读者的哪一个具体行动?
- 实现该行动,必须被核实的最小事实有哪些?
- 哪些内容属于观点/经验,必须与事实区分开写?
2)资料阶段:先收证,再写作
做法:将证据放进结构化“证据盒”,写作只允许引用盒子里的内容。
证据表(可贴到 Notion/表格)
编号 | 证据类型 | 摘要(≤50字) | 原文摘录 | 来源链接 | 获取时间(可选) | 可信度 |
---|---|---|---|---|---|---|
E01 | 官方文档/公告 | … | … | … | … | 高 |
E02 | 学术/白皮书 | … | … | … | … | 高 |
E03 | 媒体/数据平台 | … | … | … | … | 中 |
来源权威性矩阵
来源类型 | 典型特征 | 适用场景 | 注意事项 |
---|---|---|---|
官方/原始记录 | 可溯源、可验证 | 规则/接口/价格/版本 | 留意更新与地域差异 |
权威机构/学术 | 方法严谨、可复现 | 定义、指标、趋势 | 关注样本与限制 |
主流媒体/数据平台 | 覆盖面广 | 背景/二次解读 | 优先回溯到一手来源 |
3)写作阶段:结构内嵌“证据位”
段落骨架(可直接粘贴到编辑器)
[小标题]
论点:一句话。
证据:{E编号} + 关键摘录(≤40字)。
解释:为什么该证据能支撑论点(≤80字)。
限制条件:该论点不适用的前提/边界(≤40字)。
带证写作提示词
角色:严谨写作者。
输入:MVCF 清单 + 证据表(仅可引用表中证据)。
要求:
- 采用“论点—证据—解释—限制条件”写段落;
- 在正文以【E01】【E02】等方式内联标注;
- 生成文末“参考与来源”列表,与证据表完全一致,不得虚构;
- 对涉及数字/版本/价格的句子,括注获取时间或来源。
引用与标注规范
- 正文用【E01】、【E02】标注;
- 文末“参考与来源”按 E 编号排序,附链接与来源类型;
- 表述中避免“所有/唯一/必然”等绝对化词语。
4)发布前:机器+人工双重自检
4.1 机器自检(让模型做“审稿助理”)
角色:事实核查编辑。
输入:全文草稿 + 证据表。
输出:
1) 列出所有包含数字/版本/价格的句子,逐条核对是否有【E编号】支撑;
2) 标出没有任何引用的断言;
3) 识别歧义(时间、地名、术语),给出更严谨改写;
4) 输出“高风险段落”清单(无引用/跨段跳跃/过度泛化)。
4.2 人工抽检(快检流程)
- 抽样核对:随机抽 3 段,打开来源页面,搜索关键字确认存在。
- 交叉阅读:让非作者同事只读小标题与段首句,看能否复述核心结论。
- 链接有效性:检查外链可达性与锚点是否正确。
- 红线检查:涉隐私/合规/投资建议等,增加免责声明或二次审阅。
图表与数据呈现规范
- 坐标基线:能从 0 起就从 0 起,避免夸大差异;若无法从 0 起,必须注明原因。
- 样本与口径:说明样本量、时间窗口、统计口径;避免把同比/环比混写。
- 单位统一:同一图内不混用不同单位;必要时增加双轴说明。
- 小数与四舍五入:统一保留位数;避免因四舍五入导致总和≠100%。
- 相对值 vs 绝对值:同时给出,以免误导。
- 可访问性:图表给 alt 文本;表格有表头(<th>)。
检查项 | 通过标准 | 备注 |
---|---|---|
坐标与单位 | 基线清晰、单位统一 | 必要时双轴并标注 |
样本与口径 | 说明样本量与口径 | 避免口径切换 |
四舍五入 | 合计不偏差 | 统一小数位 |
术语一致性与命名规范
为高频术语建立“名词表”,统一写法与首现解释,避免同义多写与语义偏移。
术语 | 统一写法 | 不推荐写法 | 备注 |
---|---|---|---|
大模型 | 大语言模型(LLM) | AI 模型(笼统) | 首现给出缩写 |
上下文长度 | 上下文窗口 | 上下文大小 | 给出单位(token) |
常见反例与改写示范
反例 1:绝对化表述
❌ “所有团队都应该采用 X。”
✅ “在 资源有限、交付周期短 的团队中,X 的上线速度更快;对于 强合规/重审计 的场景,Y 更合适。”【E01】
反例 2:版本错配
❌ “该功能已支持 A、B、C。”(未指明来源与获取时间)
✅ “官方变更记录显示当前支持 A、B;C 处于受限试用阶段。”【E02】
反例 3:偷换比较口径
❌ “X 的使用量增长最快。”(把同比与环比混用)
✅ “在相同统计口径下,X 的环比增速高于 Y、Z;若按同比口径,Y 更高。”【E03】
附:快速启动包(复制即用)
A. 文章开头模版(把“真实承诺”写在前面)
本文所有涉及数字、版本、价格等陈述均附来源;若未来来源更新,将在文末“修订记录”处标注。你也可以按【E编号】自行复核。
B. “修订记录”模版(版本号驱动)
修订记录
- v1.0:首次发布。
- v1.1:更新 E05,替换失效链接,数值从 X 调整为 Y。
- v1.2:新增“图表与数据呈现规范”章节。
C. 风险词替换表(降低夸大与绝对化)
高风险词 | 建议替换 |
---|---|
所有、从不、必然 | 多数情况下、在…条件下、通常 |
最强、唯一、首个 | 更适合…的、在…维度领先、较早 |
智能/革命性(空泛) | 具体能力+指标(如“支持 10K token 上下文”) |
D. 带证草稿的一键自检提示词
角色:审稿与事实核查助手。
输入:正文 + 证据表。
任务:
- 标出无引用的断言;对每条给出“建议引用类型”;
- 检查数字/单位/口径一致性,输出修正建议;
- 检查链接可达性与锚点匹配;
- 生成“高风险段落”列表并说明原因。
E. 证据表 CSV 模版(粘贴到表格工具可用)
id,type,summary,quote,source,acquired(optional),cred
E01,official,"……","……","……","……",high
E02,academic,"……","……","……","……",high
E03,media,"……","……","……","……",medium
发布前终极清单
- 每个 MVCF 是否都有对应【E编号】支撑?
- 是否为每个主要结论写明限制条件与适用范围?
- 数字/单位/口径是否统一(含百分比与总和)?
- 图表是否从合理基线开始?是否附样本与口径说明?
- “参考与来源”是否与证据表一一对应、无失配?
- 外链是否可达,锚点是否正确?
- 是否存在绝对化或空泛词?已替换为更精确表述?
- 是否添加必要的免责声明(隐私/合规/投资建议等)?
- 修订记录是否按版本号记录关键变更?
结语
写得顺口并不难,难的是可复核。把“证据—结构—自检”做成标准件,你的文章就会从“像真”变成“可证真”。这套流程与任何工具/平台解耦,即使更换模型与编辑器,也能保持一致的事实与风格底线。