健康险精算师必读系列 | 用观测数据进行因果推断
长期以来,随机对照试验一直被认为是临床研究中因果推理的“黄金标准”。在缺乏随机实验的情况下,很难确定可靠的干预点。但随机对照试验又经常受到伦理约束的挑战。因此,建立了利用观察数据进行因果推断的方法,且越来越多地应用到临床医学、卫生政策和公共卫生研究上来。本研究概述了专门为观察数据中的因果推断设计的最新方法以去除混杂因素对实验结果的影响,且所述方法在有日常收集的行政数据和电子健康记录(“大数据”)的情况下可用性不断增大。
随机对照试验(RCTs)的局限性
不能进行随机试验的原因主要包括:难以遵守指定的干预措施、难以跟踪登记的参与者(审查)、对审查员或参与者的盲化能力有限、不成功的随机化(混淆) 。
同时,随机对照试验还有以下几个缺点:
1、外部波动:强内部差异性往往伴随着低外部波动性的代价,使得结果可能只代表特定群体,而不适用于整体。
2、经济层面:随机对照试验通常费用高昂且耗时久,但治疗策略总是急需的,并不能等那么久。且,一般情况下,资源及预算约束使得用随机对照试验得到的信息的价值太有限以至于很难说服公众基金的投入。
3、道德限制:有些条件或治疗策略对实验者有害或至少不是最优方式,这个时候试验会存在道德问题。
用观察数据进行因果推断的方法介绍
工具变量回归分析法(IV)
用工具变量来表示随机差异。工具变量只影响关注的暴露变量,但与结果或非观测的混杂因素变量相互独立。例如,在研究牙周炎与BMI之间潜在的因果关系时,用与BMI相关位点结合的遗传风险评分作为BMI的工具变量。研究结果表明肥胖不是牙周炎的相关风险因素。
该方法的局限性是它要求一个强烈影响暴露变量又与未测量的混杂因素相独立,同时仅通过影响暴露变量间接的影响结果的工具。
差异分析(DiD)
该方法需要包含特定干预前后的实验组和控制组的数据,且要求控制组和实验组都遵循相同的时间趋势且只有实验组暴露在干预中。两组结果在干预前后的变化值的差异即为干预的影响。
该方法的有效性依赖于控制组的稳定性,即结果中包含的干预前的趋势在实验组和控制组中是否可以清晰的区分开来。同时,如果非目标干预对实验组和控制组的影响不同,该方法也存在缺陷。
面板数据:固定和随机效应
面板数据可以拆分出单个效应,来捕捉可能与观测的解释变量相关的未观测的不随时间改变的特征。该方法可用于结果变量依赖于与观测的解释变量相关的未观测的混杂因素的情况。
潜在的结果偏差主要来源于选择,随时间变化的混杂因素以及不随时间变化的下降集群引起的强度降低。
回归不连续设计(RDD)
它利用了关于导致治疗状态差异的规则的知识,例如某一截断日期前后出生的个体或跨过特定年龄界限的个体。该方法的逻辑就是假设个体结果会随机的落在左右两侧。通常越临近边界值时,假设的置信度越高。
寻找合适描述关系的函数以及合适的窗口宽度在回归中起着相当重要的角色,并且规则在实操中被严格遵循的程度直接影响了该方法的精度。
用观察数据进行因果推断的局限性
为回答特定问题所需要的恰当的干预可能很难找到;
外部波动以及结果的普适性很有限;
使用自然实验成功与否取决于目标群体的大小。但如果相关性太小,即使再大的目标群体也会让结果的力度大打折扣;
需要满足不同方法所做出的假设。但有时假设的有效性不能直接检验。因此,设计较好的检验总是尽可能详细的描述背景并介绍经验模型的可选规范。
结论
本文只是整理了目前的一些方法,但多的是希望激起大家讨论的热情,继续研究如何更有效得进行因果推断。
参考文献
[1] Listl S , Hendrik Jürges, Watt R G . Causal inference from observational data[J]. Community Dentistry and Oral Epidemiology, 2016.
声明:MEWS矩阵所刊载内容之知识产权为MEWS矩阵及相关权利人专属所有或持有。未经许可,禁止进行转载、摘编、复制及建立镜像等任何使用。
不感兴趣
看过了
取消
不感兴趣
看过了
取消
精彩评论
相关阅读