news 2026/1/28 3:21:35

【2025 NeurIPS】Wan-Move: Motion-controllable Video Generation via Latent Trajectory Guidance

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【2025 NeurIPS】Wan-Move: Motion-controllable Video Generation via Latent Trajectory Guidance

paper: https://arxiv.org/pdf/2512.08765
code: https://github.com/ali-vilab/Wan-Move/

文章目录

  • 核心问题
  • 核心思想
  • 方法
  • 数据集构建
  • Benchmark 方法
  • 主要贡献

核心问题

旨在解决现有运动可控视频生成方法中存在的控制粒度粗糙模型可扩展性有限的问题 。

  • 挑战性:现有的方法通常依赖额外的运动编码器(如 ControlNet),这不仅增加了模型复杂性,还可能在编码过程中导致运动信号衰减,且难以在大规模基础模型上进行高效微调 。

核心思想

关键洞察是:直接通过编辑图像条件特征来注入运动信息,而无需添加任何辅助模块

  • 动机:利用 VAE 模型的平移等变性(Translation Equivariance) 。如果第一帧的特征代表了物体外观,那么将这些特征沿轨迹传播到后续帧的对应位置,就能自然地引导模型合成符合预期运动的视频 。

方法

Wan-Move构建在 Wan-I2V-14B 基础模型之上,核心流程如下:

  • 潜在轨迹映射:首先使用点轨迹(Point Trajectories)表示运动,并将其从像素空间确定性地投影到潜在空间坐标中
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/1/22 0:46:21

你不知道的Q#调试黑科技:如何让Python端实时捕获量子状态异常

第一章:你不知道的Q#调试黑科技:如何让Python端实时捕获量子状态异常在混合量子-经典计算架构中,Q# 与 Python 的协同调试长期面临“黑盒”困境——量子态无法直接观测,异常往往滞后暴露。然而,借助 Q# 的 DumpMachine…

作者头像 李华
网站建设 2026/1/26 18:59:16

新型僵尸网络正对路由器、摄像头等设备发起大规模DDoS攻击

新型僵尸网络正对路由器、摄像头等设备发起大规模DDoS攻击 趋势科技的一项新研究发现,自 2024 年底以来,一个新发现的物联网 (IoT) 僵尸网络一直利用路由器、IP 摄像头和其他连接设备等物联网设备中的漏洞,在全球策划…

作者头像 李华
网站建设 2026/1/17 3:19:01

看完 2025 年 IT 圈就业现状,26 届往后的考生该选计算机专业吗?

收藏!不想35岁被淘汰?网络安全或许是程序员的最佳转型方向 计算机专业虽进入分化阶段,但网络安全人才缺口达300万,高端领域供不应求。高校扩招与市场需求脱节导致供需失衡,未来"计算机行业"的复合型人才更具…

作者头像 李华