证据等级金字塔
膳食补充剂证据从机制研究、观察性研究到随机对照试验和系统综述不等。本页用于解释不同证据类型的强弱、用途和局限,帮助读者理解 概念页 与 慢病指引 中的证据表述。
常见证据层级
| 层级 | 研究类型 | 能回答的问题 | 主要局限 |
|---|---|---|---|
| 低 | 个案报告 / 病例系列 | 是否出现过某种现象或不良反应 | 不能判断普遍性和因果关系 |
| 低-中 | 横断面研究 | 某时点营养状态与健康指标是否相关 | 无法判断时间顺序 |
| 中 | 病例对照研究 | 某暴露是否与疾病相关 | 回忆偏倚、选择偏倚较常见 |
| 中 | 队列研究 | 暴露与未来结局是否相关 | 残余混杂仍可能存在 |
| 中-高 | 随机对照试验 RCT | 某干预是否导致某结果变化 | 样本量、剂量、随访时间和人群选择会影响外推 |
| 高 | 系统综述 SR | 某问题的全部研究总体显示什么 | 质量取决于纳入研究与综述方法 |
| 高 | Meta 分析 | 多个研究合并后的定量效应 | 高异质性时合并结果需谨慎解释 |
| 高 | Cochrane 系统综述 | 严格方法学下的干预效果评估 | 更新周期、纳入标准和证据缺口仍需关注 |
| 高但需看适用性 | 临床实践指南 / 共识声明 | 专家组如何把证据转化为建议 | 不同机构可能因价值判断或地区因素给出不同建议 |
| 方法框架 | GRADE | 证据质量和推荐强度如何分级 | 需要结合具体结局、人群和干预进行判断 |
证据等级不等于简单排序
证据金字塔是有用框架,但不能机械使用。
- 高质量 RCT 通常比观察性研究更能支持因果判断,但如果 RCT 剂量不合理、样本过小或随访太短,结论仍可能不稳定。
- 系统综述和 Meta 分析位于较高层级,但如果纳入研究质量差或异质性极高,合并结果也可能不可靠。
- 对严重不良反应,个案报告和药物警戒数据可能比小型 RCT 更早发现风险信号。
- 对基础缺乏人群有效的营养素,未缺乏人群中的 RCT 可能显示无效;这不代表该营养素没有生理必要性。
营养补充剂证据的特殊问题
| 问题 | 解释 | 阅读建议 |
|---|---|---|
| 基线状态差异 | 缺乏者与不缺乏者补充同一营养素,效果可能完全不同 | 查看研究是否测量基线水平,如 25(OH)D、铁蛋白、B12 |
| 剂量异质性 | 不同研究剂量、形式、给药频率差异大 | 不只看成分名,还要看剂量和形式 |
| 结局替代指标 | 研究可能只改善血液指标,不改善临床结局 | 区分“生物标志物改善”和“疾病风险下降” |
| 随访时间不足 | 骨密度、心血管事件等结局需要较长观察期 | 短期研究不能证明长期获益或安全 |
| 多成分配方 | 难以判断是哪一种成分起作用 | 对综合配方证据要谨慎外推到单体成分 |
| 发表偏倚 | 阳性研究更容易发表 | 优先看注册试验、系统综述和偏倚评估 |
统计显著 vs 临床有意义
一个结果可以“统计显著”,但临床意义很小。阅读补充剂研究时应同时看:
- 效应量大小:差异是否足以影响实际决策;
- 绝对风险变化:ARR 和 NNT 往往比 RR 更直观;
- 置信区间:范围是否宽、是否跨越无效线;
- 安全性与成本:小效应是否值得长期补充;
- 人群适用性:研究对象是否与目标用户相似。
Cochrane、指南与机构意见如何使用
- Cochrane 更适合回答“某干预是否有效”。
- NIH ODS、EFSA 更适合查询 RDA、AI、UL、食物来源和安全性。
- ISSN 更适合运动营养与补充剂表现相关问题。
- 临床指南更适合疾病场景下的综合决策,但补充剂通常只是辅助内容。