网页排名向量更新:迭代聚合算法的应用与优化
1. 近似矩阵与平稳分布
在构建聚合矩阵时,我们不使用精确的删失分布 $s^T$ 来构建精确的聚合矩阵 $C$,而是使用向量 $\tilde{s}^T = \omega^T / \omega^T e$ 来近似 $s^T$,从而构建 $\tilde{C}$。这里,$\delta^T = s^T - \tilde{s}^T$ 和 $E = C - \tilde{C}$ 的量级是相同的。这意味着,如果能合理构建划分 $S = L \cup \overline{L}$,使得 $\delta^T$ 的量级较小,那么 $\tilde{C}$ 就会接近 $C$,它们各自的平稳分布 $\tilde{\xi}^T$ 和 $\xi^T$ 也会相近,进而保证对于 $i \leq l$,$\tilde{\pi}_i$ 和 $\pi_i$ 相近。
不过,马尔可夫链有时对小扰动很敏感,所以在得出上述结论前需要谨慎。衡量平稳概率对转移概率变化的敏感程度有多种方法,包括转移矩阵次主导特征值的大小、各种“条件数”的大小以及平均首达时间的大小等。即使 $\delta^T$(以及 $E$)的分量较小,$\tilde{\xi}i$ 和 $\xi_i$(进而 $\tilde{\pi}_i$ 和 $\pi_i$)也可能相差较大。例如,当 $G{12}$ 的量级较小时,$C$ 的次主导特征值接近 1,平稳概率就会对扰动敏感。当然,如果 $C$ 定义的链条件良好,$\xi^T$ 对小扰动就相对不敏感,$\omega^T$ 近似 $\pi^T_2$ 的程度就能更直接地反映 $\tilde{\pi}_i$ 近似 $\pi_i$ 的程度。