源自风暴统计网:一键统计分析与绘图的AI网站
交叉滞后模型(Cross-Lagged Panel Model, CLPM)常被用来检验纵向数据中的因果效应,被广泛应用于心理学、医学、社会科学等领域。
然而,近期美国密歇根州立大学教授、《人格与社会心理学杂志(JPSP)》主编Richard E. Lucas发表一篇预印本论文,对此方法提出尖锐的批评。
他对随机选出的变量进行交叉滞后模型分析,发现98%的模型竟然都是显著的,由此提出交叉滞后模型根本不宜用来检验纵向因果效应。
事实上,这已经不是Lucas教授第一次锤它了。他于2023年在《Advances in Methods and Practices in Psychological Science》上发文指出:“有人主张经典交叉滞后在一些情况下可用,而我认为在任何情况下它都不可用。”
2025年他在《European Journal of Personality》上继续发文批驳,检测交叉滞后模型的虚假效应。
交叉滞后模型到底有什么问题?如果这种方法要被舍弃,有什么其他替代方法?
交叉滞后经典模型回顾
横断面研究因无法确定变量的先后关系而被批评,研究者转而追踪两个变量在两个以上时间点的测量结果,以此推断因果路径。它的基本模型如下(x、y都测量了2次):
主要包括三类关系:
自回归路径:同一变量在不同时间点的关系,如Y₁与Y₂;
交叉路径:不同变量在不同时间点的关系,如X₁预测一段时间后的Y₂;
同步相关:不同变量在同一时间点的关系,如X₁与Y₁。
交叉滞后模型的特色在于它能控制自回归效应。举个例子,若想研究收入和幸福感的关系,第二次测量的幸福感高可能并不是因为先前的收入高,而是因为第一次测量的幸福感也高。
所以,可以运用统计手段把Y₁对Y₂控制住,如果X₁对Y₂的效应仍然显著,意味着X₁对Y₂做出了超越Y₁对Y₂的增益贡献。
交叉滞后模型真的有用吗?
1.存在的主要问题
Lucas教授首先介绍了CLPM存在的主要缺陷:混淆了个体间(Between-person)和个体内(Within-person)效应。
个体间效应:不同个体之间稳定的差异(例如,收入高的人比收入低的人更幸福)
个体内效应:个体围绕自己平均水平的波动(例如,某个人在收入高的年份比收入低的年份更幸福);
在交叉滞后模型的框架下,个体长期平均水平之间的相关会被误认为是跨时间的因果效应。比如,第二次测量时小A比小B的幸福感高可能并不是因为先前的收入高,而是因为小A的幸福水平本来就比较高。
另外,该模型的问题还包括“状态”变异:该变异存在于某一时间点但不延续到未来的测量中。
2.出现虚假因果关系的概率
Lucas教授采用澳大利亚家庭、收入与劳动力动态 (HILDA) 调查的数据,选取了相关系数在 0.20–0.70 之间的500对变量,之后从中随机抽取 100 对进行CLPM分析,要求至少包含连续5波数据。
除了CLPM,Lucas教授另外检验了以下3种模型:
RI-CLPM:为X和Y引入随机截距的潜变量,反映人与人之间差异的稳定特质
ARTS:引入状态因素;
STARTS:引入稳定特质因素和状态因素。
结果显示,98% 的CLPM模型至少有一个方向的交叉滞后效应显著,91%的模型两个方向均显著;中位数效应大小为 0.098,大于以往文献中交叉滞后效应的中位数(0.07)。
RI-CLPM 的显著比例下降,ARTS 与 STARTS 更低。
Lucas教授还进行了低相关变量对测试,发现即使变量对相关系数低于0.20,仍有63%的CLPM模型著效应。
这些结果表明,CLPM 几乎总是产生显著效应,即使变量对是随机选择的,它无法提供严格的因果检验。
有何替代解法和应对之策?
基于以上分析和结果,Lucas教授认为,研究者应避免仅依赖CLPM进行因果推断;可以使用其他模型替代,如 RI-CLPM、ARTS 或 STARTS,同时谨记各模型仍有局限之处;
若不同模型结果不一致(如RI-CLPM显著而ARTS不显著),需提供理论与实证依据支持所选模型。
其实,跳出模型本身,CLPM 最大的问题或许在于研究者在使用时缺乏因果推断的思维方式:
在建模时,研究者除了控制一些基本的人口学变量,有没有系统地考虑潜在的未测混杂因素?
有没有绘制有向无环图(Directed Acyclic Graph)来明确假设的因果结构?
是否进一步评估,当遗漏的混杂因素与 X 和 Y 的相关程度达到何种程度时,回归结果中 X 对 Y 的效应才会降为零,或失去统计显著性?
当这些工作都做到位,再加上运用更合理的统计模型,因果推断才能令人信服。
参考文献:Lucas, R. E. (2025). The Cross-Lagged Panel Model Almost Always Provides Evidence for Causal Effects.
关于郑老师团队及公众号
【因果推断与机器学习】未来医学科研的大势所趋
临床、护理、公卫的朋友们,2026年,将是诸位因果推断方法革新的一年。郑老师团队推出“因果推断与机器学习”训练营,丰富的因果推断方法教学,课程理论结合R语言实操,覆盖从基础到进阶的完整链条,欢迎参加!
模块一:理论
1.流行病任务与因果推断;2.因果推断与偏倚控制
模块二:回归与G方法
3.回归的方法及其应用;4.G方法及实践
模块三:倾向得分
5.倾向得分方法;6.倾向得分加权
模块四:机器学习
7.机器学习理论;8. 机器学习与 G方法;9.机器学习与倾向得分
模块五:双重稳健估计方法
10.双重稳健方法;11.双重机器学习
模块六:TMLE方法
12.TMLE 方法;13.机器学习与 TMLE方法
模块七:缺失数据填补与因果推断
14.缺失数据填补与机器学习;15.缺失数据填补后双重稳健估计
模块八:中介分析与因果中介
16.中介分析与因果中介;17.双重稳健估计下的中介分析
模块九:处理效应异质性分析
18.处理异质性分析方法;19.因果森林方法
报名训练营,请添加郑老师助教微信咨询(微信:aq566665)