目录
- 一、研究背景与问题
- 二、核心理论基础
- (一)多元霍克斯过程定义
- (二)关键定义
- (三)连续时间到离散时间的转化
- (四)基于秩约束的结构发现
- 三、算法设计:两阶段迭代算法
- (一)算法流程
- (二)可识别性与复杂度
- 四、实验验证
- (一)实验设置
- (二)实验结果
- 五、结论与未来方向
- 六、附录补充
一、研究背景与问题
- 霍克斯过程的应用价值:多元霍克斯过程(Multivariate Hawkes Process)是建模复杂系统中时间依赖和事件驱动交互的强大框架,广泛应用于社交网络、神经科学、金融等领域。
- 现有方法的局限:现有方法多聚焦于揭示观测子过程间的因果结构,默认“因果充分性”假设(所有与任务相关的子过程均被观测),但现实系统常存在部分观测的情况,潜在子过程会干扰因果发现,可能导致观测子过程间出现虚假因果边,得出错误系统动态结论。
- 研究目标:在无潜在子过程存在性、数量、连接位置等先验知识的情况下,恢复观测子过程与潜在子过程间的因果结构。
论文:Causal Structure Learning in Hawkes Processes with Complex Latent Confounder Networks 地址:https://openreview.net/forum?id=mA78uXqcnl请各位同学给我点赞,激励我创作更好、更多、更优质的内容!^_^
关注微信公众号,获取更多资讯
二、核心理论基础
(一)多元霍克斯过程定义
- 由计数子过程集合N G = { N i } i = 1 l N_{G}=\{N_{i}\}_{i=1}^{l}NG={Ni}i=1l构成,N i ( t ) N_{i}(t)Ni(t)记录截至时间t tt的i ii类事件数。
- 子过程N i N_{i}Ni的强度函数为λ i ( t ) = μ i + ∑ j = 1 l ∫ 0 t ϕ i j ( t − s ) d N j ( s ) \lambda_{i}(t)=\mu_{i}+\sum_{j=1}^{l} \int_{0}^{t} \phi_{i j}(t-s) d N_{j}(s)λi(t)=μi+∑j=1l∫0tϕij(t−s)dNj(s),其中μ i \mu_{i}μi为背景强度,ϕ i j ( s ) \phi_{i j}(s)ϕij(s)为激发函数(衡量历史j jj类事件对后续i ii类事件的衰减影响)。
- 平稳性要求影响矩阵Φ \PhiΦ(元素Φ i j = ∫ 0 ∞ ϕ i j ( s ) d s \Phi_{i j}=\int_{0}^{\infty} \phi_{i j}(s) d sΦij=∫0∞ϕij(s)ds)的谱半径小于1。
图1:多元霍克斯过程示意图。(a)包含三个子过程N 1 N_{1}N1、N 2 N_{2}N2、N 3 N_{3}N3的点过程表示,其中连续时间线被划分为长度为Δ的区间。(b)相应的汇总因果图,这是本文的核心对象,具有因果关系N 1 ← N 2 ↔ N 3 N_{1} \leftarrow N_{2} \leftrightarrow N_{3}N1←N2↔N3,且所有节点上都有自环。(c)窗口因果图,展示了潜在的时滞因果机制:每个节点表示长度为Δ的一个区间内的计数,该计数被建模为滞后父节点的加权和加上噪声(式1)。(d)一个包含潜在子过程L 1 L_{1}L1混淆O 1 O_{1}O1和O 2 O_{2}O2的最小示例,突出了本文的主要研究重点。
(二)关键定义
- 部分观测多元霍克斯过程因果模型(PO-MHP):有向图G : = ( N G , E G ) G:=(N_{G}, E_{G})G:=(NG,EG),节点代表子过程(含p pp个观测节点O G O_{G}OG和q qq个潜在节点L G L_{G}LG),有向边E i j E_{i j}Eij存在当且仅当∫ 0 t ϕ i j ( t − s ) d N j ( s ) > 0 \int_{0}^{t} \phi_{i j}(t-s) d N_{j}(s)>0∫0tϕij(t−s)dNj(s)>0,允许循环和自环。
- 因果关系:若存在从N i N_{i}Ni到N j N_{j}Nj的有向路径,则N i N_{i}Ni是N j N_{j}Nj的原因,N j N_{j}Nj是N i N_{i}Ni的结果。
- 父因集:对N i N_{i}Ni,最小集合P G ⊆ N G ∖ { N i } P_{G} \subseteq N_{G}\setminus\{N_{i}\}PG⊆NG∖{Ni},所有从N G ∖ { N i } N_{G}\setminus\{N_{i}\}NG∖{Ni}到N i N_{i}Ni的有向路径均经过P G P_{G}PG,若N i N_{i}Ni有自环则自身也包含于P G P_{G}PG。
- 局部独立性:子过程N i N_{i}Ni在给定P G P_{G}PG时,与N G ∖ P G N_{G}\setminus P_{G}NG∖PG局部独立,当且仅当P G P_{G}PG是N i N_{i}Ni的父因集。
(三)连续时间到离散时间的转化
- 定理4.1(霍克斯过程作为线性自回归模型):当时间窗口大小Δ → 0 \Delta \to 0Δ→0时,平稳多元霍克斯过程可表示为线性自回归模型N i ( n ) = ∑ j = 1 l ∑ k = 1 n θ i j ( k ) N j ( n − k ) + ε i ( n ) + θ i ( 0 ) N_{i}^{(n)}=\sum_{j=1}^{l} \sum_{k=1}^{n} \theta_{i j}^{(k)} N_{j}^{(n-k)}+\varepsilon_{i}^{(n)}+\theta_{i}^{(0)}Ni(n)=∑j=1l∑k=1nθij(k)Nj(n−k)+εi(n)+θi(0),其中N i ( n ) N_{i}^{(n)}Ni(n)为第n nn个时间窗口的离散事件计数,θ i ( 0 ) = Δ ⋅ μ i \theta_{i}^{(0)}=\Delta \cdot \mu_{i}θi(0)=Δ⋅μi,θ i j ( k ) = ∫ ( k − 1 ) Δ k Δ ϕ i j ( s ) d s \theta_{i j}^{(k)}=\int_{(k-1) \Delta}^{k \Delta} \phi_{i j}(s) d sθij(k)=∫(k−1)ΔkΔϕij(s)ds,ε i ( n ) \varepsilon_{i}^{(n)}εi(n)为序列不相关的白噪声。
- 实际处理:激发函数通常有有限支撑,可截断滞后项至有效滞后数K KK,通过网格搜索选择合适Δ \DeltaΔ(需小于激发函数支撑,且使恢复结构对Δ \DeltaΔ小扰动稳健)。
(四)基于秩约束的结构发现
- 引理4.2(窗口图中的d-分离与秩约束):在PO-MHP的窗口因果图中,变量集C v C_{v}Cvd-分离A v A_{v}Av和B v B_{v}Bv,当且仅当交叉协方差矩阵∑ A v ∪ C v , B v ∪ C v \sum _{A_{v} \cup C_{v}, B_{v} \cup C_{v}}∑Av∪Cv,Bv∪Cv的秩等于∣ C v ∣ |C_{v}|∣Cv∣。
- 观测父因集识别(命题4.3):在PO-MHP中,观测子过程O 1 O_{1}O1的父因集P G P_{G}PG(子集于O G O_{G}OG),等价于窗口图中P G P_{G}PG对应滞后变量集P v P_{v}Pv是包含O 1 ( n ) O_{1}^{(n)}O1(n)所有父变量的最小集、d-分离O 1 ( n ) O_{1}^{(n)}O1(n)与其他变量、交叉协方差矩阵满足特定秩条件。
- 潜在混杂子过程识别
- 假设1(激发函数):ϕ i j ( s ) = a i j w ( s ) \phi_{i j}(s)=a_{i j} w(s)ϕij(s)=aijw(s),a i j a_{i j}aij为常数(衡量事件类型间影响),w ( s ) w(s)w(s)为仅依赖时滞的公共衰减函数(如指数衰减)。
- 对称无环路径场景(定义4.4):潜在混杂子L 1 L_{1}L1到观测效应子过程集O G 1 O_{G1}OG1的有向路径仅含中间潜在子过程、路径长度相同且无环,中间潜在子过程无自环。
- 命题4.5(从观测效应识别潜在混杂):在秩忠实性假设下,特定交叉协方差矩阵秩为2 m + 1 2m + 12m+1(m mm为有效滞后数),当且仅当存在潜在混杂子L 1 L_{1}L1(为O 1 , O 2 O_{1}, O_{2}O1,O2父因集成员),且L 1 L_{1}L1与O 1 , O 2 O_{1}, O_{2}O1,O2满足对称路径场景。
- 观测代理(定义4.6):为推断的潜在子过程L 1 L_{1}L1指定一个观测效应作为代理(如D e ( L 1 ) = O 1 De(L_{1})=O_{1}De(L1)=O1),S i b ( D e ( L 1 ) ) Sib(De(L_{1}))Sib(De(L1))为其他受L 1 L_{1}L1影响的观测子过程集。
- 定理4.7(含潜在混杂的父因集识别):通过观测代理构建变量集,交叉协方差矩阵满足特定秩条件,可识别含潜在混杂的父因集。
- 定理4.8(从潜在混杂识别潜在混杂):扩展定理4.7,可识别影响已有潜在混杂子过程的新潜在混杂子过程。
三、算法设计:两阶段迭代算法
(一)算法流程
- 初始化:部分因果图G : = ∅ G:=\emptysetG:=∅,活跃子过程集A G : = O G A_{G}:=O_{G}AG:=OG(初始为观测子过程集)。
- 迭代循环:
- Phase I(因果关系识别):遍历A G A_{G}AG中每个子过程,用当前A G ∪ O G A_{G} \cup O_{G}AG∪OG测试其父因,若父因集完全包含于该集合,用命题4.3和定理4.7识别,将子过程从A G A_{G}AG移除,直至无更新。
- Phase II(新潜在子过程发现):若Phase I无法进一步识别,穷举A G A_{G}AG中所有对子,用命题4.5和定理4.8搜索新潜在混杂子,合并重叠对子对应的潜在子,更新A G A_{G}AG(添加新潜在子、移除其效应子),返回Phase I。
- 终止条件:A G A_{G}AG为空或无更新,输出因果图G GG。
(二)可识别性与复杂度
- 定理5.1(因果图可识别性):在激发函数假设和秩忠实性下,若每个潜在混杂子及其至少2个观测代理满足对称路径场景,则含观测与潜在混杂子的因果图可识别;无潜在子时,仅Phase I即可完全识别。
- 计算复杂度:依赖子过程数量(含潜在混杂子)和因果图密度,Phase I复杂度上界为O ( n ! ∑ k = 1 m ( m k ) ) O(n! \sum_{k=1}^{m}\binom{m}{k})O(n!∑k=1m(km))(n nn为A G A_{G}AG中子过程数,m mm为增强过程集T G T_{G}TG中子过程数),Phase II复杂度上界为O ( ( n 2 ) ) O(\binom{n}{2})O((2n))。
四、实验验证
(一)实验设置
- 数据集
- 合成数据:6类合成图(含全观测图和5类含潜在子的图),对比方法包括基于似然的霍克斯方法(SHP、THP、NPHC)、基于秩的i.i.d.方法(Hier. Rank、RLCD)、时间序列方法(LPCMCI),评估指标为F1分数(综合精确率和召回率)。
- 真实数据:公开蜂窝网络数据集(含18类告警、55个设备、约3.5万事件),聚焦设备id=8的5类告警子图(将Alarm_id=7设为潜在子)。
- 实现细节:合成数据用tick库生成霍克斯过程事件序列,离散化时间窗口长度设为0.1,有效滞后数根据相关性确定;标准化离散数据,用典型相关分析(CCA)测试秩缺陷。
(二)实验结果
- 合成数据:所提方法(Discrete和Hawkes两种版本)在所有场景下F1分数均高于基线,潜在子场景需更大样本量(因果影响沿潜在路径衰减,需更多数据可靠检测)。
- 真实数据:成功识别出潜在子Alarm_id=7及其主要影响,F1分数(0.76)显著高于基线(最高0.49);合并所有设备数据时,因违背“相同生成机制”假设,F1分数降至0.17,验证了按设备分析的合理性。
- 敏感性与稳健性分析
- 时间离散化间隔Δ \DeltaΔ:Δ ≤ 0.1 \Delta \leq 0.1Δ≤0.1时性能稳定且高,Δ = 0.3 \Delta=0.3Δ=0.3时因时间分辨率丢失性能骤降。
- 秩测试阈值:阈值0.1在不同场景下平衡精确率和召回率。
- 秩忠实性违背:随机为两条边分配相同系数,方法仍保持良好性能,样本量增大时性能提升。
- 对称路径条件违背:轻微破坏对称路径(插入1 - 2个中间潜在子),性能仅轻微下降,证明方法实用稳健。
- 小样本量:5k样本下,所提方法仍保持有竞争力的精确率和F1分数。
- 大规模复杂图:14个子过程的复杂图上,随样本量增加,F1分数逐步提升(30k样本0.58,80k样本0.75)。
五、结论与未来方向
- 结论:提出PO-MHP框架,通过子协方差秩条件和路径约束,推导可识别性的充要条件,设计两阶段迭代算法,在合成和真实数据上验证了方法能有效恢复含潜在混杂子的因果结构。
- 未来方向:放松激发函数假设(如引入节点特定衰减率)、降低算法复杂度、将方法应用于更多真实数据集以获取领域洞察。
六、附录补充
含详细相关工作(点过程、霍克斯过程、因果发现)、多元霍克斯过程细节、中间潜在子过程识别、秩忠实性、算法细节、复杂度分析、实验补充(数据生成、评估指标、更多场景结果)等内容,为理论和实验提供完整支撑。