最强因果推断方法，必须是这个组合（超级学习者+双重稳健估计）-洪萨配资

源自风暴统计网：一键统计分析与绘图的网站

在观察性研究中，如何准确估计某种干预或暴露对结局的因果效应，一直是流行病学与数据科学中的核心难题。

近年来，“超级学习者（Super Learner）”与“双重稳健估计器”的组合，逐渐成为因果推断领域的一把利器。它既能灵活拟合数据，又具备良好的统计性质，被越来越多研究者采用。

那么，这个组合到底强在哪里？是否真的需要集成“一大堆”算法？今天，我们通过一篇2025年发表于《Epidemiology》（医学二区，IF=4.4）的研究，来一探究竟。

双重稳健估计器：两道“保险”的因果估计

双重稳健估计器，主要包括增强逆概率加权（AIPW）和靶向最大似然估计（TMLE）。

它们被称为“双重稳健”，是因为只要倾向得分模型（预测个体接受处理的可能性）或结果模型（预测个体在不同处理下的潜在结局）中有一个被正确设定，那么得到的因果效应估计就是渐进无偏的。

这相当于为因果估计上了两道“保险”，大大降低了对单一模型设定正确性的依赖。

更值得一提的是，它们允许使用复杂的机器学习算法来拟合这两个模型，而不会破坏估计的理论性质（如低偏误、可信的置信区间等）。

超级学习者：集百家之长的“元学习器”

虽然机器学习算法灵活，但如何选择最合适的算法本身是个难题。超级学习者提供了一种优雅的解决方案：它不是单一算法，而是一个集成学习框架。

研究者可以预先准备一个丰富多样的“算法库”，其中包含从简单线性模型、岭回归/LASSO，到随机森林、梯度提升、神经网络、MARS等多种算法及其不同参数组合。

超级学习者通过交叉验证，评估每个子算法在预测上的表现，并以最小化预测误差为目标，为所有子算法分配最优权重，最终将它们组合成一个强大的“元预测器”。

理论证明，超级学习者的表现不会差于算法库中最好的那个子算法。

算法选择对因果估计的实际影响

为了检验算法选择对因果估计的实际影响，研究团队利用“初产妇妊娠结局研究：监测准妈妈（nuMoM2b）”的7923名孕妇数据，结合超级学习器，使用AIPW和TMLE的估计来评估高水果蔬菜摄入密度（≥2.5杯/1000千卡）对先兆子痫风险的平均处理效应（ATE）。

具体而言，研究比较了超级学习器纳入不同算法组合时的平均处理效应估计值，并评估这些估计结果是否对集成学习中纳入不同的算法库集合敏感。

1.因果图识别混杂因素

研究通过因果图识别混杂因素，并在所有分析模型中对26个混杂因素（13个连续变量，13个分类变量）进行调整。

2.构建算法库

为实证探索超级学习器集成算法选择对因果效应估计的影响，我们估计了平均处理效应。我们使用超级学习器配合平方损失函数来拟合结局模型和倾向评分模型，该损失函数通过非负最小二乘法最小化。

我们的算法库最多包含10组算法：

（1）随机森林（含500棵树，每个节点至少50个观测值，每次分裂随机选择5、6或7个预测变量）；

（2）极端梯度提升（含500棵树，最大树深度为4、5或6，收缩参数为0.01、0.1或0.3）；

（3）广义线性模型；

（4）弹性网络正则化广义线性模型（混合参数α = 0， 0.25， 0.5， 0.75或1.0）；

（5）具有t分布先验的贝叶斯广义线性模型；

（6）基于赤池信息准则进行前向、后向或逐步变量选择的广义线性模型；

（7）多元自适应回归样条（最大允许交互阶数为3、4或5）；

（8）具有逻辑激活函数的单隐藏层神经网络（隐藏层含5、7或9个单元，权重衰减参数为0.01或0.1，包含或不包含跳跃层连接）；

（9）k最近邻算法（最近邻数k为5、10或50）；

（10）简单均值。

总体而言，算法库最多包含41个具有不同调参设定的子算法，代表了基于树、基于回归以及惩罚模型等多种建模方法，覆盖了广泛的算法应用场景。

3.随后进行了两种比较：

排除单一算法：每次从参考算法库中逐一排除单个候选算法，从而创建一个超级学习器集成。这共产生了10个不同的超级学习器集成，我们将其统称为SL(−x)。例如，SL(−xgboost) 表示使用除极端梯度提升算法之外的所有上述算法进行拟合的超级学习器集成。

使用单一算法：每次只使用一类算法构建集成，每个集成仅包含一种候选算法及其相关的所有超参数设定。这共产生了10个不同的超级学习器算法，我们将其统称为SL(x)。例如，SL(xgboost) 表示仅使用极端梯度提升算法（包括通过不同调优参数设定构建的所有变体）进行拟合的超级学习器集成。

4.关键发现如下：

（1）完整集成库结果稳健：使用完整算法库的超级学习者配合AIPW/TMLE，得出高水果蔬菜摄入可降低先兆子痫风险（AIPW: -0.019；TMLE: -0.023）。

（2）集成优于单一最佳模型

超级学习者集成模型在预测倾向得分和结局时的均方误差（MSE），在结局模型上的均方误差为0.077，在倾向评分模型上为0.120。不高于算法库中任何单一的最佳子算法。

参考超级学习器集成拟合的结局模型系数与子算法均方误差

参考超级学习器集成拟合的倾向评分模型系数与子算法均方误差

（3）使用单一算法波动显著增大：如果只依赖某一种算法（如仅用XGBoost或KNN）进行估计，结果会出现较大偏差，且置信区间更宽，表现不稳定。

（3）“排除法”影响甚微：从完整库中排除任何一个单一算法（即SL(−x)）的 AIPW 和 TMLE 的估计（即使是表现最好的随机森林或GLM），对最终的ATE点估计值和95%置信区间上都几乎没有影响。

总而言之，“超级学习者 + 双重稳健估计器（AIPW/TMLE）”的组合，为我们提供了一个强大、灵活且稳健的因果推断框架。

它的“强”体现在：

双重稳健性：对模型误设更宽容，估计更可靠。
数据适应性：通过集成多种机器学习算法，自动适应数据的复杂模式。
实践稳定性：多样化的算法库能有效避免因依赖单一算法而导致的估计波动。

对于实践者而言，这项研究也提示我们，不必在算法选择上过度焦虑或追求极致复杂，构建一个覆盖主流建模方法（如广义线性模型、正则化回归、树模型、神经网络等）的、适度多样的算法库，往往就能取得稳定可靠的因果效应估计结果。

这正是在有限计算资源下，进行高效且可靠因果推断的“最强组合”。

最后，在文末给郑老师我们团队打个广告吧，大家不要见怪哈！

欢迎加入“因果推断与机器学习科研训练营”

最强因果推断方法，必须是这个组合（超级学习者+双重稳健估计）

超级学习者：集百家之长的“元学习器”

什么是Java 的“显式哲学”？

Python毕设选题推荐：Python Flask基于CS架构的医院财务管理系统基于python+CS架构的医院财务管理系统【附源码、mysql、文档、调试+代码讲解+全bao等】

Qwen3-4B-Instruct实战案例：用CPU版‘最强智脑’写小说+写代码

Matlab科研利器：DeepSeek-OCR数据提取教程

传统Restful API快速集成AI Agent：3种方案+选型指南

浦语灵笔2.5-7B实战：如何用AI自动解析文档图表内容