news 2026/1/16 3:13:14

初探Langevin dynamics(朗之万动力学)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
初探Langevin dynamics(朗之万动力学)

文章目录

    • 一、直觉理解:
    • 二、连续形式(SDE 视角)
    • 三、为什么它能「采样」?
    • 四、离散形式(算法角度)
    • 五、和机器学习的对应关系
      • 5.1 Langevin MCMC
      • 5.2 SGLD(Stochastic Gradient Langevin Dynamics)
    • 六、和 Diffusion Model 的关系
      • 6.1 反向扩散 = Langevin-like dynamics
      • 5.2 Score matching = 学梯度
    • 七、和 Tweedie Estimator[^1] 的桥梁
    • 八、总结
    • 参考

一、直觉理解:

Langevin dynamics =「有噪声的梯度下降」

想象一个小球在能量地形U ( x U(xU(x) 上滚动:

  • 梯度项
    小球会沿着「能量下降最快的方向」滚
    ⇒ \Rightarrow普通梯度下降

  • 随机噪声项
    环境温度导致的小抖动
    ⇒ \Rightarrow帮助跳出局部极小值

👉 所以:

Langevin dynamics = 梯度下降 + 随机热噪声

朗之万动力学通过两个关键力的博弈实现系统调控:摩擦力像水中的阻力让粒子减速,随机力模拟分子碰撞带来的无规则扰动。当这两种力达到平衡时,系统会自然趋向玻尔兹曼分布——这正是复杂概率采样的物理基础。

二、连续形式(SDE 视角)

标准的过阻尼 Langevin SDE

d x t = − ∇ U ( x t ) d t + 2 T d W t \boxed{ \mathrm{d}x_t = - \nabla U(x_t)\mathrm{d}t + \sqrt{2T}\mathrm{d}W_t }dxt=U(xt)dt+2TdWt

各项含义

含义
x t x_txt系统状态(参数、样本、粒子位置)
U ( x U(xU(x)势能函数(能量)
− ∇ U ( x -\nabla U(xU(x)确定性“往低能走”
W t W_tWtWiener 过程(布朗运动)
T TT温度(噪声强度)

三、为什么它能「采样」?

这是Langevin dynamics 的核心魔法

如果你让上面的 SDE 跑足够久,它的稳态分布是:

p ( x ) ∝ e − U ( x ) / T \boxed{ p(x) \propto e^{-U(x)/T} }p(x)eU(x)/T

这就是Boltzmann 分布

换句话说

  • 你不需要知道如何直接采样p ( x p(xp(x)
  • 只要能算∇ U ( x \nabla U(xU(x)
  • 就可以用 Langevin dynamics 从p ( x p(xp(x) 中采样

四、离散形式(算法角度)

Euler–Maruyama 离散化:

x k + 1 = x k + η ∇ U ( x k ) − 2 T η ϵ k , ϵ k ∼ N ( 0 , I ) \boxed{ x_{k+1} = x_k + \eta \nabla U(x_k) - \sqrt{2T\eta}\epsilon_k, \quad \epsilon_k \sim \mathcal{N}(0,I) }xk+1=xk+ηU(xk)2Tηϵk,ϵkN(0,I)

这看起来是不是非常眼熟?

👉SGD + Gaussian noise

五、和机器学习的对应关系

5.1 Langevin MCMC

令:

U ( x ) = − log ⁡ p ( x ) U(x) = - \log p(x)U(x)=logp(x)

则更新变成:

x k + 1 = x k + η ∇ log ⁡ p ( x k ) − 2 η ϵ k x_{k+1} = x_k + \eta \nabla \log p(x_k) - \sqrt{2\eta}\epsilon_kxk+1=xk+ηlogp(xk)2ηϵk

👉用梯度信息做 MCMC

5.2 SGLD(Stochastic Gradient Langevin Dynamics)

在大数据场景中:

  • 用 mini-batch 估计∇ log ⁡ p ( x \nabla \log p(xlogp(x)
  • 噪声天然存在

👉 SGD ≈退化版 Langevin dynamics

六、和 Diffusion Model 的关系

6.1 反向扩散 = Langevin-like dynamics

扩散模型的反向 SDE:

d x = [ f ( x , t ) − g ( t ) 2 ∇ x log ⁡ p t ( x ) ] d t + g ( t ) d W ˉ t \mathrm{d}x = \big[ f(x,t) - g(t)^2 \nabla_x \log p_t(x) \big] \mathrm{d}t + g(t)\mathrm{d}\bar W_tdx=[f(x,t)g(t)2xlogpt(x)]dt+g(t)dWˉt

其中:

  • ∇ x log ⁡ p t ( x \nabla_x \log p_t(xxlogpt(x):score
  • 噪声 + score 驱动采样

👉 本质上是时间变化版 Langevin dynamics

5.2 Score matching = 学梯度

  • Langevin dynamics:已知∇ log ⁡ p ( x \nabla \log p(xlogp(x)→ 采样
  • Diffusion model:先学 score→ 再用 Langevin/SDE 采样

七、和 Tweedie Estimator1的桥梁

在高斯噪声下:

E [ x 0 ∣ x t ] = x t + σ t 2 ∇ log ⁡ p t ( x t ) \boxed{ \mathbb{E}[x_0 \mid x_t] = x_t + \sigma_t^2 \nabla \log p_t(x_t) }E[x0xt]=xt+σt2logpt(xt)
这意味着:

👉 反向扩散 =连续去噪版 Langevin dynamics

八、总结

Langevin dynamics 是:


参考


  1. 一文解释 经验贝叶斯估计, Tweedie’s formula ↩︎

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/1/13 17:20:22

运维工程师技术教程之ELK日志监控

ELK(现在通常称为 Elastic Stack,加入 Beats 后扩展为 ELKB)在运维工作中使用非常广泛,是企业级日志管理、监控告警、故障排查的主流开源解决方案,尤其是在中大型互联网公司、云原生架构、分布式系统的运维场景中&…

作者头像 李华
网站建设 2025/12/27 23:43:24

Cocos事件优先级深度解析:从交互冲突到精准控制的完整指南

Cocos事件优先级深度解析:从交互冲突到精准控制的完整指南 【免费下载链接】cocos-engine Cocos simplifies game creation and distribution with Cocos Creator, a free, open-source, cross-platform game engine. Empowering millions of developers to create …

作者头像 李华
网站建设 2025/12/27 23:43:22

Java内存分配

栈:方法运行时使用的内存,比如main方法运行,进入方法栈中执行。堆:存储对象或者数组(实际上数组是特殊的对象),new来创建的,都存储在堆内存。方法区:存储可以运行的class…

作者头像 李华
网站建设 2026/1/15 17:53:57

使用Rust生态重构Git工作流:告别传统命令行的现代方案

使用Rust生态重构Git工作流:告别传统命令行的现代方案 【免费下载链接】libgit2 A cross-platform, linkable library implementation of Git that you can use in your application. 项目地址: https://gitcode.com/gh_mirrors/li/libgit2 你是否曾经因为Gi…

作者头像 李华
网站建设 2025/12/27 5:54:59

激光熔敷与增材制造技术:流体模拟与激光同轴送粉熔池数值分析

激光熔敷激光增材流体模拟,激光同轴送粉熔池模拟最近在研究激光熔敷和激光增材制造中的流体模拟,特别是激光同轴送粉熔池的模拟。这玩意儿挺有意思的,尤其是当你看到熔池在激光作用下如何流动、如何形成最终的沉积层时,感觉就像在…

作者头像 李华