news 2026/4/15 16:30:59

ITransformer: Inverted Transformers Are Effective for Time Series Forecasting

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
ITransformer: Inverted Transformers Are Effective for Time Series Forecasting


解释典型的Transformer架构用于时序预测效果差的原因,它们的观点:

由单个时间步长形成的Token,由于过于局部的感受野同时时间点表示的时间不对齐事件而难以显示有益信息。

时间序列预测模型的标准设定:

输入 (历史窗)XXX:包含TTT个时间步,NNN个变量。矩阵维度为RT∗NR^{T*N}RTN;

输出(预测窗)YYY: 预测未来SSS个时间步,同样包含NNN个变量, 矩阵维度为RS∗NR^{S*N}RSN

数据处理的两种视角:

(1)Xt,:X_{t,:}Xt,::ttt时刻所有变量的快照。表示的是Excel表格中的一行,代表“此时此刻所有传感器的读数”。大多数Transformer(如Informer)是将这个Xt:X_{t:}Xt:, 作为一个TokenTokenToken输入模型。

(2)X:,nX_{:,n}X:,n: 第nnn个变量的完整时间序列,Excel中的一列,代表 ”某个传感器在过去一段时间内的所有读数“。

为什么否定Xt,:X_{t,:}Xt,:?

直接处理Xt,:X_{t,:}Xt,:(即把同一时刻的不同变量揉在一起)在物理意义上的两个缺点:

(1)系统性时滞(Systematical Time Lags):在现实世界中,因果关系往往不是瞬时的,如果强制模型只看Xt:X_{t:}Xt:(同时关注ttt时刻的A和B),可能变量在该时刻并不具备直接因果关系的数据点,真正的关联式错位的。

(2)物理量纲与分布的差异:同一时刻的Xt,:X_{t,:}Xt,:包含了性质完全不同的数据。这些数据的语义空间(Semantic Space)完全不同。虽然可以归一化,但是在深度学习,将这些物理意义极不相同的数值映射到同一个特征空间进行交互,难以学习到鲁棒的特征。

为什么拥抱X:nX_{:n}X:n?

单个变量的整条序列具有物理一致性,该变量在ttt时刻和t+1t+1t+1时刻的物理性质不变,它们的统计分布是平稳的。将X:nX_{:n}X:n视为一个Token进行Embedding,模型更容易学习到特征。

层归一化:

在此前Transformer中,层归一化将同一时刻的的多个变量进行归一化,使**每个变量杂糅无法区分**,提高了注意力建模词关联的难度。一旦收集到的数据没有按时间对齐,该操作还将引入延迟过程之间的噪声干扰。

在倒置版本中,层归一化作用于Variate Token内部,让所有变量的特征都**处于相对统一的分布下,减弱测量单位的差异**。这种方式还可以有效处理时间序列的非平稳问题问题。

前馈网络:

基于多层感知机的万能表示定理,前馈网络作用在整条序列上,能够提取序列的内在属性,例如幅值,周期性,频率谱(傅立叶变换可视作在序列上的全连接映射),从而提高在其他的序列上的泛化性。

在原始的Transformer中,模型的预测效果不一定随着输入的历史观测的变长而提升,在使用倒置框架之后,模型随着历史观测长度的增加,呈现明显的预测误差降低趋势。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/14 15:53:31

EssentialPIM Pro:一站式个人信息管理工具,让生活更高效

在信息爆炸的时代,高效的个人信息管理工具显得尤为重要。EssentialPIM Pro作为一款功能全面的个人信息管理软件,集成了日历、联系人、任务、笔记等核心功能,堪称Microsoft Outlook的轻量级替代品。本文将从实际使用体验出发,详细介…

作者头像 李华
网站建设 2026/4/15 15:05:12

破除信息壁垒,强化系统联动,IBMS系统打造建筑智能控制核心

在智慧建筑飞速发展的当下,楼宇自控、安防监控、消防报警、能耗监测等子系统如同建筑的“四肢”,支撑着日常运营的每一项功能。但在传统管理模式中,各子系统独立运行、数据互不互通,形成一道道“信息壁垒”,不仅导致设…

作者头像 李华
网站建设 2026/4/2 6:21:32

如何定位个人IP方向?

——别急着拍视频,先想清楚这3件事最近和不少朋友聊天,发现一个有趣的现象: 不管是程序员、设计师、销售,还是开厂的老板、做培训的老师,越来越多人在问:“我是不是也该做个个人IP?” “但我到底…

作者头像 李华
网站建设 2026/4/4 13:30:36

10 个降AI率工具,本科生高效避坑指南

10 个降AI率工具,本科生高效避坑指南 AI降重工具:高效避坑,让论文更自然 随着人工智能技术的飞速发展,越来越多的本科生在撰写论文时开始依赖AI辅助工具。然而,AI生成的内容往往存在明显的“AI痕迹”,不仅容…

作者头像 李华
网站建设 2026/4/10 18:00:01

巴菲特与全球市场的互动关系

巴菲特与全球市场的互动关系 关键词:巴菲特、全球市场、投资理念、价值投资、市场影响、互动机制、投资策略 摘要:本文深入探讨了巴菲特与全球市场的互动关系。从巴菲特独特的投资理念和策略出发,分析其投资行为如何对全球市场产生影响,同时全球市场的动态变化又怎样作用于…

作者头像 李华
网站建设 2026/4/11 21:56:37

32 RTC实时时钟-独立定时器

一、前言 1.RTC简介 RTC(Real Time Clock,实时时钟),是一个掉电后仍然可以继续运行的独立定时器。 RTC模块拥有一个连续计数的计数器,在相应的软件配置下,可以提供时钟日历的功能。修改计数器的值可以重新…

作者头像 李华