news 2026/3/23 2:02:35

MLIR 中最常用的方言

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
MLIR 中最常用的方言

MLIR 的强大之处在于它的多层方言栈。通过不同层级的方言,MLIR 可以从高级的算法描述一直转换到最底层的机器码。

按照从“高级/抽象”到“低级/具体”的顺序,以下是 MLIR 中最常用的方言:


1. 高层方言 (High-Level / Domain Specific)

这类方言通常靠近算法逻辑,比如深度学习。

  • TOSA(Tensor Operator Set Architecture):

  • 用途:提供了一套标准化的张量算子(如卷积、池化、激活)。

  • 地位:它是很多模型转换器的入口(如 TensorFlow/PyTorch 导入 MLIR 后通常先转为 TOSA)。

  • Linalg(Linear Algebra):

  • 用途:处理结构化控制流和线性代数。

  • 核心:它既可以表示张量计算,也可以表示内存计算。它能自动生成嵌套循环,是生成高性能代码的关键层。


2. 中层/通用方言 (Mid-Level / Infrastructure)

这类方言是 MLIR 的“粘合剂”,几乎在所有程序中都会用到。

  • Arith(Arithmetic):

  • 用途:基础算术运算。处理整数和浮点数的加减乘除、位运算、常量定义。

  • Func(Function):

  • 用途:处理函数定义、调用、返回。是构建程序结构的基础。

  • ControlFlow(CF):

  • 用途:处理分支跳转(br)、条件判断(cond_br)等原始控制流。

  • SCF(Structured Control Flow):

  • 用途:提供高级的结构化循环(scf.forscf.ifscf.while)。比起 CF 更加易于分析和优化。


3. 数据与内存方言 (Data Management)

决定了数据在硬件中是如何存放和访问的。

  • Tensor:

  • 特点:不可变(Immutable)的数据抽象。主要用于高层图优化,不涉及具体内存地址。

  • MemRef(Memory Reference):

  • 特点:可变(Mutable)的内存引用。它描述了数据在内存里的布局(形状、步长、偏移)。

  • 转换:通常由Tensor方言通过Bufferization(缓冲化)转换而来。

  • Index:

  • 用途:专门用于表示数组下标、循环索引的类型,屏蔽了不同硬件上 32 位或 64 位整数的区别。


4. 底层/硬件方言 (Low-Level / Target Specific)

这类方言已经非常接近汇编语言。

  • LLVM:

  • 用途:MLIR 的“最后一公里”。它几乎与 LLVM IR 对应,用于最后交给 LLVM 后端生成机器码。

  • Vector:

  • 用途:处理 SIMD(单指令多数据)指令。它是高性能计算的核心,负责把普通计算映射到 CPU 的专用向量寄存器(如 AVX512)。

  • GPU:

  • 用途:抽象了 GPU 的并行逻辑(如 Kernel 发射、线程块、共享内存)。它可以进一步转换为NVVM(NVIDIA) 或ROCDL(AMD)。


总结:一个典型的编译路线图

当你编译一个模型时,数据通常是这样“降级”(Lowering)的:

  1. 输入:PyTorch 模型
  2. TOSA/Linalg:描述“我要做一个卷积”。
  3. SCF / Affine:把卷积拆解成“几层for循环”。
  4. Vector / MemRef:把循环里的计算变成“向量加法”,并分配物理内存。
  5. LLVM:变成 LLVM IR。
  6. 输出:二进制可执行文件。
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/13 16:37:18

快速理解Keil和Proteus联调核心要点

掌握Keil与Proteus联合调试:从配置到实战的完整指南在单片机开发的世界里,你是否也曾经历过这样的场景?刚写完一段串口通信代码,迫不及待想烧进芯片看看结果——结果板子没反应。是程序逻辑错了?引脚接反了&#xff1f…

作者头像 李华
网站建设 2026/3/14 1:42:29

PaddlePaddle Swin Transformer迁移学习实战

PaddlePaddle Swin Transformer迁移学习实战 在工业质检、医疗影像分析和智能零售等实际场景中,开发者常常面临一个共性难题:如何用有限的标注数据训练出高精度的图像分类模型?传统卷积网络虽然稳定,但在复杂纹理与细粒度差异识别…

作者头像 李华
网站建设 2026/3/14 10:14:06

5分钟搞定全网歌词:LDDC工具的极致体验

5分钟搞定全网歌词:LDDC工具的极致体验 【免费下载链接】LDDC 精准歌词(逐字歌词/卡拉OK歌词)歌词获取工具,支持QQ音乐、酷狗音乐、网易云平台,支持搜索与获取单曲、专辑、歌单的歌词 | Accurate Lyrics (verbatim lyrics) Retrieval Tool, supporting QQ Music, Ku…

作者头像 李华
网站建设 2026/3/21 14:50:26

3步搞定实时语音降噪:让你的视频会议告别背景噪音烦恼

3步搞定实时语音降噪:让你的视频会议告别背景噪音烦恼 【免费下载链接】speechbrain A PyTorch-based Speech Toolkit 项目地址: https://gitcode.com/GitHub_Trending/sp/speechbrain 你是否经历过这样的尴尬时刻?正与客户视频会议时&#xff0c…

作者头像 李华
网站建设 2026/3/19 10:48:36

3分钟掌握Windows字体美化:No!! MeiryoUI终极使用手册

3分钟掌握Windows字体美化:No!! MeiryoUI终极使用手册 【免费下载链接】noMeiryoUI No!! MeiryoUI is Windows system font setting tool on Windows 8.1/10/11. 项目地址: https://gitcode.com/gh_mirrors/no/noMeiryoUI 还在为Windows系统单调的界面字体感…

作者头像 李华