最佳实践指南

FactScope 擅长的场景

  • 客观、可被公开证据直接验证的陈述。 诸如“有没有 / 是否发生 / 是否批准”这类二元判断最容易给出裁决。
  • 监管与商业化状态。 “是否获批 / 是否上市 / 是否量产 / 是否中标”等问题与流水线的来源分级完全匹配。
  • MES 断言。 针对某项技术的“存在性 / 可行性 / 适用范围 / 所处阶段”都会触发内置的 MES(existence / feasibility / context / stage)检查。
  • 带时间与数量边界的事实。 “到 2025 Q3 是否 >=1000 辆”“截至 2024-12-31 收入是多少”便于时间守门器判断。
  • 措辞审计。 想确认宣传稿是否把“研究”说成“商用”或夸大范围,可用该工具查找限定条件。

Simple 模式会按照 ceil(字符数 / 600) 抽取主张,单次最多 12 条,超过软上限 3 条会弹出二次确认。请把任务拆分到最重要的主张,避免被截断。

不适合交给 FactScope 的问题

  • 主观评价与价值判断(更好/更美观/更有前途)。
  • 因果归因与反事实(“完全因为…”、“如果…就会…”)。
  • 纯预测性断言(“明年一定会…”)。
  • 依赖非公开或内部数据的陈述——系统只能引用公开来源,通常只能给出 unclear
  • 容易触发安全审查的内容;omni-moderation-latest 会在输入 / 输出两端拦截,一旦命中直接终止任务。

如何更有效地提问

提问模板

目标对象:谁 / 什么实体(公司、监管机构、产品、药物、项目)
动作与状态:做了什么(获批、发布、投运、量产、发表)
时间与范围:何时、地区/适应症/型号/批次
证据期待:优先的来源(监管官方、学术、招标、权威媒体)
可选提示:locale("zh" 或 "en")、常用别名、链上/备案 ID

示例好问题

  • “药物 X 是否在 2025 年获 FDA 批准用于 Y 适应症?请提供官方链接。”
  • “到 2025 年 Q3,城市 A 的氢燃料公交是否已投入 >=1000 辆?优先要市政公告或招标/交付记录。”
  • “公司 B 是否已经在中国实现产品 C 的量产?如有,请给监管备案或财报披露。”

示例不佳问题(建议改写)

  • “X 技术是不是很成熟?” → “X 技术是否已有商用部署?在哪些行业/国家?请附上线时间。”
  • “Y 比 Z 强多少?” → “在公开基准 K 上,Y 是否超过 Z?差距多少?评测报告是哪一篇?”

结合流水线逻辑的额外提示

  • 超长文本请按话题拆成 ~2000 字一块,避免自适应主张上限截断掉重点结论。
  • 每条主张会提前扣 1 积分,任务失败或被拦截会自动退款;超过 3 条主张会要求你手动勾选,便于只核查高价值条目。
  • 混合中英文时记得设置 locale,系统仍会自动生成双语检索式,但 locale 会决定输出语言与建议措辞。
  • 每条主张默认生成 ≤3 条检索式;直接在问题里补充别名、同义词或时间过滤,可减少无效搜索。
  • 当前并发为 2 条主张;与其一次性粘贴 10+ 条,不如拆成多个小批次并行发起,整体更快。
  • 按业务价值排序主张,把最重要的陈述放在文本最前面,优先保证它们被核查。
  • 即使使用中文叙述,也在问题里写上常见英文别名或缩写,减少系统翻译误差。
  • 如有特定来源偏好(监管批文、学术论文、招标文件),提前写明,检索阶段会优先搜这些材料。
  • 每次提问都带上明确时间点(如“截至 2025-09-30”),避免有效证据被判定为过期。

证据与时效性(系统会这样做)

  • 来源分层: 监管/政府/同行评审 > 机构/高校 > 头部媒体 > 其他媒体/博客。高层级来源会触发更高置信度(受 SOURCE_TYPE_WEIGHT 影响)。
  • 时间守门: 证据的发布时间早于主张时间会被降权或标记 outdated,请写出你关心的时间点。
  • 多源一致: 只有单一来源时置信度会被压低;敏感议题尽量要求两个及以上独立来源。
  • 检索窗口: 每条检索语句只保留少量候选(默认最多 12 条,展示 3 条),主题越聚焦越能留下最优片段。
  • 失败退款: 被安全拦截或执行失败会自动退回预扣积分;若流水线完成但给出 unclear,则视为一次有效核查。

如何解读裁决标签

标签含义建议动作
supported证据充分且一致。可按原句引用,记得附来源。
supported_with_qualifier结论成立但仅限特定条件(地区、版本、时间)。采纳推荐限定语,必要时设置提醒重新核查。
partial只有部分属实或关键要素缺失。拆分主张,仅保留已证实的部分。
contradicted权威证据与陈述相反。视为被证伪,除非出现新证据。
unclear公开证据不足或描述过于模糊。提供更多上下文或可引用的材料。
misleading_phrasing措辞混淆阶段(如研究 vs. 商用)或夸大范围。对照报告中的推荐表述进行改写。

将报告输出转成行动

  • 把报告里的“推荐表述”视为可直接引用的安全版本,尤其是在出现限定条件或措辞风险时,按提示改写对外文案。
  • 将“缺失证据”列表当作待办事项,补齐对应的批文/公告/论文后再发起核查,往往能把 partial/unclear 提升到 supported

提升 “supported” 命中率的写法

  • 精准命名:机构全称、药品/产品学名或型号、法规编号。
  • 补上时间点:“截至 2025-09-30” 或 “在 2024 Q4”。
  • 限定范围:国家/适应症/车型/批次/版本号。
  • 指向证据:若已有线索,可附“官方站点/期刊名/公告名”。
  • 避免话术:少用“已落地全国”“行业第一”这类无法量化的表述。
  • 告诉系统你期望的来源层级(监管、学术或媒体),便于重排模型优先该层级。
  • 如涉及内部数据,请同时提供可公开引用的佐证,否则大概率得到 unclear

常见误区与对策

误区后果对策
只引用新闻稿因缺少一手来源被降级。补充监管官网、专利、年报或审计文件。
时间模糊(“最近”“今年”)temporal_check 标记 missing 并降低置信度。写成绝对日期或季度。
试点当商用易触发 misleading_phrasing说明“试点/POC/原型/量产”的阶段词。
忽略地区差异监管主体错配导致被判矛盾。点名“在中国”“在欧盟”“在美国”等范围。
一次粘贴 10+ 条主张自适应上限会截断,且超过软上限需手动确认。按优先级拆成 ≤3 条一批。
中英混写但未指明查询构建需要额外转换。设置 locale 或保持单一语言。
询问非公开指标裁决多为 unclear改问带公开痕迹的结果(批文、备案、招标)。

快速示例(可直接改填)

  1. “是否属实:公司 C 已在 2025-06 于欧盟上市产品 D。请核对:监管/公告链接、上市国家、版本/型号、时间线。”
  2. “求核查:‘到 2025 Q3,项目 E 投运 >=500 台设备’。证据优先级:政府公告/年报 > 头部媒体 > 其他。”
  3. “判断阶段:技术 F 在常温常压下达到指标 G。请给同行评审论文或高校/政府报告,并标注实验条件与发布日期。”

复制上述模板、替换实体即可投入工作台。

面向不同场景的建议

  • 合规 / 法务: 用“是否获批/公告是否生效”来提问,并要求文件编号或公开链接。
  • 产品 / 市场: 强调“是否商用/量产/客户落地”,并写清时间、客户类型与地区。
  • 科研 / 技术: 指定实验条件、样本、基准、复现实验材料以及论文/数据集链接。

遵循这些最佳实践,可显著提升命中 supported 的概率,并获得更高层级、可追溯的引用。