Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN 计算内核,并能够在现代 GPU 硬件上以最大吞吐量运行。
更多 Triton 中文文档可访问 →http://triton.hyper.ai/
*在线运行 Triton 学习教程
链接是:https://hyper.ai/notebooks/35867?utm_source=Distribute&utm_medium=Distribute-Triton&utm_campaign=Distribute-Triton-260126
triton.language.swizzle2d(i, j, size_i, size_j, size_g)将行主序的size_isize_j 矩阵的索引转换为每组 size_g* 行的列主序矩阵的索引。
例如, 对 size_i = size_j = 4 和 size_g = 2,它将转换
[[0 , 1 , 2 , 3 ], [4 , 5 , 6 , 7 ], [8 , 9 , 10, 11], [12, 13, 14, 15]]为
[[0, 2, 4 , 6 ], [1, 3, 5 , 7 ], [8, 10, 12, 14], [9, 11, 13, 15]]