news 2026/5/9 19:58:32

CANN/ops-cv空间变换器算子

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN/ops-cv空间变换器算子

SpatialTransformer

【免费下载链接】ops-cv本项目是CANN提供的图像处理、目标检测相关的算子库,实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-cv

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品
Atlas 200I/500 A2 推理产品×
Atlas 推理系列产品
Atlas 训练系列产品

功能说明

算子功能:Spatial Transformer Network (STN) 算子用于对输入张量进行仿射变换。该算子通过变换矩阵 theta 对输入图像 x 进行空间变换,输出变换后的图像 y。

参数说明

参数名输入/输出/属性描述数据类型数据格式
x输入输入张量。INT8、INT16、INT32、INT64、UINT8、UINT16、UINT32、UINT64
FLOAT16、FLOAT、DOUBLE
NCHW、NC1HWC0
theta输入变换矩阵,包含仿射变换参数。INT8、INT16、INT32、INT64、UINT8、UINT16、UINT32、UINT64
FLOAT16、FLOAT、DOUBLE
ND
y输出变换后的输出张量。INT8、INT16、INT32、INT64、UINT8、UINT16、UINT32、UINT64
FLOAT16、FLOAT、DOUBLE
NCHW、NC1HWC0
output_size属性指定输出的高度和宽度,包含 2 个整数。默认为 [-1, -1],表示使用输入尺寸。ListInt-
default_theta属性默认的仿射变换参数,当 use_default_theta 为 true 时使用。默认为空列表。ListFloat-
align_corners属性如果为 true,则输入和输出张量的 4 个角像素中心对齐,保留角像素的值。默认为 false。Bool-
use_default_theta属性指定哪些 theta 参数从 default_theta 使用。1 表示使用默认值,0 表示使用输入 theta。默认为空列表。ListInt-

约束说明

  • 输入张量 x 的格式必须为 NCHW 或 NC1HWC0。
  • 输出张量 y 的格式必须与输入张量 x 的格式一致。
  • 变换矩阵 theta 的形状必须为 [batch, 2, 3] 或 [2, 3]。
  • 当 use_default_theta 为空列表时,使用输入 theta 进行变换。
  • 当 use_default_theta 不为空时,对应位置为 1 的参数使用 default_theta 中的值,为 0 的参数使用输入 theta 中的值。

调用说明

调用方式样例代码说明
图模式调用test_geir_spatial_transformer通过算子IR构图方式调用SpatialTransformer算子。

【免费下载链接】ops-cv本项目是CANN提供的图像处理、目标检测相关的算子库,实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-cv

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 19:58:14

观察Taotoken在跨地域访问下的API响应延迟与自动路由效果

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 观察Taotoken在跨地域访问下的API响应延迟与自动路由效果 1. 测试背景与目的 在日常开发与使用大模型API的过程中,网络…

作者头像 李华
网站建设 2026/5/9 19:58:12

华为通信库子通信域配置创建

HcclCreateSubCommConfig 【免费下载链接】hcomm HCOMM(Huawei Communication)是HCCL的通信基础库,提供通信域以及通信资源的管理能力。 项目地址: https://gitcode.com/cann/hcomm 产品支持情况 Ascend 950PR/Ascend 950DT&#xff…

作者头像 李华
网站建设 2026/5/9 19:57:11

AI行业经历三次关键拐点

AI行业三次关键拐点对比分析2015年OpenAI成立 初创阶段以非营利组织形态出现,马斯克与奥特曼共同推动通用人工智能(AGI)的伦理发展。技术路线聚焦开源与透明,标志性成果包括GPT-1和强化学习框架OpenAI Gym。此时行业竞争集中于算法…

作者头像 李华
网站建设 2026/5/9 19:53:43

nli-MiniLM2-L6-H768部署教程:低配GPU也能跑的极速文本分类方案

nli-MiniLM2-L6-H768部署教程:低配GPU也能跑的极速文本分类方案 1. 项目概述 nli-MiniLM2-L6-H768是一款基于cross-encoder/nli-MiniLM2-L6-H768轻量级NLI模型开发的本地零样本文本分类工具。它最大的特点是无需任何微调训练,只需输入文本和自定义标签…

作者头像 李华
网站建设 2026/5/9 19:47:30

L2-004 这是二叉搜索树吗?

L2-004 这是二叉搜索树吗?一棵二叉搜索树可被递归地定义为具有下列性质的二叉树:对于任一结点,其左子树中所有结点的键值小于该结点的键值;其右子树中所有结点的键值大于等于该结点的键值;其左右子树都是二叉搜索树。所…

作者头像 李华
网站建设 2026/5/9 19:47:30

CANN/ops-solver实数矩阵LU分解

Sgetrf 【免费下载链接】ops-solver 本项目是CANN提供的高级数值求解算子库,实现矩阵分解、求逆、特征值求解等功能在NPU上的加速计算。 项目地址: https://gitcode.com/cann/ops-solver 产品支持情况 产品是否支持Atlas 200I/500 A2 推理产品Atlas 推理系列…

作者头像 李华