最佳实践指南
FactScope 擅长的场景
- 客观、可被公开证据直接验证的陈述。 诸如“有没有 / 是否发生 / 是否批准”这类二元判断最容易给出裁决。
- 监管与商业化状态。 “是否获批 / 是否上市 / 是否量产 / 是否中标”等问题与流水线的来源分级完全匹配。
- MES 断言。 针对某项技术的“存在性 / 可行性 / 适用范围 / 所处阶段”都会触发内置的 MES(existence / feasibility / context / stage)检查。
- 带时间与数量边界的事实。 “到 2025 Q3 是否 >=1000 辆”“截至 2024-12-31 收入是多少”便于时间守门器判断。
- 措辞审计。 想确认宣传稿是否把“研究”说成“商用”或夸大范围,可用该工具查找限定条件。
Simple 模式会按照
ceil(字符数 / 600)抽取主张,单次最多 12 条,超过软上限 3 条会弹出二次确认。请把任务拆分到最重要的主张,避免被截断。
不适合交给 FactScope 的问题
- 主观评价与价值判断(更好/更美观/更有前途)。
- 因果归因与反事实(“完全因为…”、“如果…就会…”)。
- 纯预测性断言(“明年一定会…”)。
- 依赖非公开或内部数据的陈述——系统只能引用公开来源,通常只能给出
unclear。 - 容易触发安全审查的内容;
omni-moderation-latest会在输入 / 输出两端拦截,一旦命中直接终止任务。
如何更有效地提问
提问模板
目标对象:谁 / 什么实体(公司、监管机构、产品、药物、项目)
动作与状态:做了什么(获批、发布、投运、量产、发表)
时间与范围:何时、地区/适应症/型号/批次
证据期待:优先的来源(监管官方、学术、招标、权威媒体)
可选提示:locale("zh" 或 "en")、常用别名、链上/备案 ID示例好问题
- “药物 X 是否在 2025 年获 FDA 批准用于 Y 适应症?请提供官方链接。”
- “到 2025 年 Q3,城市 A 的氢燃料公交是否已投入 >=1000 辆?优先要市政公告或招标/交付记录。”
- “公司 B 是否已经在中国实现产品 C 的量产?如有,请给监管备案或财报披露。”
示例不佳问题(建议改写)
- “X 技术是不是很成熟?” → “X 技术是否已有商用部署?在哪些行业/国家?请附上线时间。”
- “Y 比 Z 强多少?” → “在公开基准 K 上,Y 是否超过 Z?差距多少?评测报告是哪一篇?”
结合流水线逻辑的额外提示
- 超长文本请按话题拆成 ~2000 字一块,避免自适应主张上限截断掉重点结论。
- 每条主张会提前扣 1 积分,任务失败或被拦截会自动退款;超过 3 条主张会要求你手动勾选,便于只核查高价值条目。
- 混合中英文时记得设置
locale,系统仍会自动生成双语检索式,但 locale 会决定输出语言与建议措辞。 - 每条主张默认生成 ≤3 条检索式;直接在问题里补充别名、同义词或时间过滤,可减少无效搜索。
- 当前并发为 2 条主张;与其一次性粘贴 10+ 条,不如拆成多个小批次并行发起,整体更快。
- 按业务价值排序主张,把最重要的陈述放在文本最前面,优先保证它们被核查。
- 即使使用中文叙述,也在问题里写上常见英文别名或缩写,减少系统翻译误差。
- 如有特定来源偏好(监管批文、学术论文、招标文件),提前写明,检索阶段会优先搜这些材料。
- 每次提问都带上明确时间点(如“截至 2025-09-30”),避免有效证据被判定为过期。
证据与时效性(系统会这样做)
- 来源分层: 监管/政府/同行评审 > 机构/高校 > 头部媒体 > 其他媒体/博客。高层级来源会触发更高置信度(受
SOURCE_TYPE_WEIGHT影响)。 - 时间守门: 证据的发布时间早于主张时间会被降权或标记
outdated,请写出你关心的时间点。 - 多源一致: 只有单一来源时置信度会被压低;敏感议题尽量要求两个及以上独立来源。
- 检索窗口: 每条检索语句只保留少量候选(默认最多 12 条,展示 3 条),主题越聚焦越能留下最优片段。
- 失败退款: 被安全拦截或执行失败会自动退回预扣积分;若流水线完成但给出
unclear,则视为一次有效核查。
如何解读裁决标签
| 标签 | 含义 | 建议动作 |
|---|---|---|
supported | 证据充分且一致。 | 可按原句引用,记得附来源。 |
supported_with_qualifier | 结论成立但仅限特定条件(地区、版本、时间)。 | 采纳推荐限定语,必要时设置提醒重新核查。 |
partial | 只有部分属实或关键要素缺失。 | 拆分主张,仅保留已证实的部分。 |
contradicted | 权威证据与陈述相反。 | 视为被证伪,除非出现新证据。 |
unclear | 公开证据不足或描述过于模糊。 | 提供更多上下文或可引用的材料。 |
misleading_phrasing | 措辞混淆阶段(如研究 vs. 商用)或夸大范围。 | 对照报告中的推荐表述进行改写。 |
将报告输出转成行动
- 把报告里的“推荐表述”视为可直接引用的安全版本,尤其是在出现限定条件或措辞风险时,按提示改写对外文案。
- 将“缺失证据”列表当作待办事项,补齐对应的批文/公告/论文后再发起核查,往往能把
partial/unclear提升到supported。
提升 “supported” 命中率的写法
- 精准命名:机构全称、药品/产品学名或型号、法规编号。
- 补上时间点:“截至 2025-09-30” 或 “在 2024 Q4”。
- 限定范围:国家/适应症/车型/批次/版本号。
- 指向证据:若已有线索,可附“官方站点/期刊名/公告名”。
- 避免话术:少用“已落地全国”“行业第一”这类无法量化的表述。
- 告诉系统你期望的来源层级(监管、学术或媒体),便于重排模型优先该层级。
- 如涉及内部数据,请同时提供可公开引用的佐证,否则大概率得到
unclear。
常见误区与对策
| 误区 | 后果 | 对策 |
|---|---|---|
| 只引用新闻稿 | 因缺少一手来源被降级。 | 补充监管官网、专利、年报或审计文件。 |
| 时间模糊(“最近”“今年”) | temporal_check 标记 missing 并降低置信度。 | 写成绝对日期或季度。 |
| 试点当商用 | 易触发 misleading_phrasing。 | 说明“试点/POC/原型/量产”的阶段词。 |
| 忽略地区差异 | 监管主体错配导致被判矛盾。 | 点名“在中国”“在欧盟”“在美国”等范围。 |
| 一次粘贴 10+ 条主张 | 自适应上限会截断,且超过软上限需手动确认。 | 按优先级拆成 ≤3 条一批。 |
| 中英混写但未指明 | 查询构建需要额外转换。 | 设置 locale 或保持单一语言。 |
| 询问非公开指标 | 裁决多为 unclear。 | 改问带公开痕迹的结果(批文、备案、招标)。 |
快速示例(可直接改填)
- “是否属实:公司 C 已在 2025-06 于欧盟上市产品 D。请核对:监管/公告链接、上市国家、版本/型号、时间线。”
- “求核查:‘到 2025 Q3,项目 E 投运 >=500 台设备’。证据优先级:政府公告/年报 > 头部媒体 > 其他。”
- “判断阶段:技术 F 在常温常压下达到指标 G。请给同行评审论文或高校/政府报告,并标注实验条件与发布日期。”
复制上述模板、替换实体即可投入工作台。
面向不同场景的建议
- 合规 / 法务: 用“是否获批/公告是否生效”来提问,并要求文件编号或公开链接。
- 产品 / 市场: 强调“是否商用/量产/客户落地”,并写清时间、客户类型与地区。
- 科研 / 技术: 指定实验条件、样本、基准、复现实验材料以及论文/数据集链接。
遵循这些最佳实践,可显著提升命中 supported 的概率,并获得更高层级、可追溯的引用。