news 2026/5/11 13:23:39

CANN/asc-devkit向量标量比较API

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN/asc-devkit向量标量比较API

asc_gt_scalar

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品是否支持
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品

功能说明

src中的每个元素逐个与标量value比较大小,如果某个位置上的元素大于value,则输出结果dst上的对应比特位为1,否则为0。

函数原型

  • 高维切分计算

    __aicore__ inline void asc_gt_scalar(__ubuf__ uint8_t* dst, __ubuf__ half* src, half value, uint8_t repeat, uint16_t dst_block_stride, uint16_t src_block_stride, uint16_t dst_repeat_stride, uint8_t src_repeat_stride) __aicore__ inline void asc_gt_scalar(__ubuf__ uint8_t* dst, __ubuf__ float* src, float value, uint8_t repeat, uint16_t dst_block_stride, uint16_t src_block_stride, uint16_t dst_repeat_stride, uint8_t src_repeat_stride)
  • 同步计算

    __aicore__ inline void asc_gt_scalar_sync(__ubuf__ uint8_t* dst, __ubuf__ half* src, half value, uint8_t repeat, uint16_t dst_block_stride, uint16_t src_block_stride, uint16_t dst_repeat_stride, uint8_t src_repeat_stride) __aicore__ inline void asc_gt_scalar_sync(__ubuf__ uint8_t* dst, __ubuf__ float* src, float value, uint8_t repeat, uint16_t dst_block_stride, uint16_t src_block_stride, uint16_t dst_repeat_stride, uint8_t src_repeat_stride)

参数说明

参数名输入/输出描述
dst输出目的操作数(矢量)的起始地址。
src输入源操作数(矢量)的起始地址。
value输入源操作数(标量)。
repeat输入迭代次数。
dst_block_stride输入目的操作数单次迭代内不同DataBlock间地址步长。
src_block_stride输入源操作数单次迭代内不同DataBlock间地址步长。
dst_repeat_stride输入目的操作数相邻迭代间相同DataBlock的地址步长。
src_repeat_stride输入源操作数相邻迭代间相同DataBlock的地址步长。

返回值说明

流水类型

PIPE_V

约束说明

  • 操作数地址重叠约束请参考通用地址重叠约束。
  • dst、src的起始地址需要32字节对齐。
  • dst按照小端顺序排序成二进制结果,对应src中相应位置的数据比较结果。
  • 当结果输出到目的地址中时,mask参数不生效。

调用示例

// 结果输出到目标地址中,固定为128个元素 constexpr uint32_t total_length = 128; __ubuf__ uint8_t dst[total_length / 8]; __ubuf__ half src[total_length]; half scalar = 20; uint8_t repeat = 1; uint8_t dst_block_stride = 1; uint8_t src_block_stride = 1; uint8_t dst_repeat_stride = 8; uint8_t src_repeat_stride = 8; …… // 数据搬运及同步操作 asc_gt_scalar(dst, src, scalar, repeat, dst_block_stride, src_block_stride, dst_repeat_stride, src_repeat_stride); …… // 同步操作

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/11 13:21:43

如何用HS2-HF_Patch一键解锁Honey Select 2完整游戏体验

如何用HS2-HF_Patch一键解锁Honey Select 2完整游戏体验 【免费下载链接】HS2-HF_Patch Automatically translate, uncensor and update HoneySelect2! 项目地址: https://gitcode.com/gh_mirrors/hs/HS2-HF_Patch HS2-HF_Patch是一款专为Honey Select 2游戏设计的一站式…

作者头像 李华
网站建设 2026/5/11 13:19:45

163MusicLyrics:网易云QQ音乐歌词提取终极方案

163MusicLyrics:网易云QQ音乐歌词提取终极方案 【免费下载链接】163MusicLyrics 云音乐歌词获取处理工具【网易云、QQ音乐】 项目地址: https://gitcode.com/GitHub_Trending/16/163MusicLyrics 163MusicLyrics是一款专为音乐爱好者设计的免费高效歌词提取工…

作者头像 李华
网站建设 2026/5/11 13:17:25

多线程冲突了怎么办?

先来看看虚构的小故事 已经晚上 11 点了,程序员小明的双手还在键盘上飞舞着,眼神依然注视着的电脑屏幕。 没办法这段时间公司业绩增长中,需求自然也多了起来,加班自然也少不了。 天气变化莫测,这时窗外下起了蓬勃大雨…

作者头像 李华
网站建设 2026/5/11 13:16:41

5分钟掌握League Akari:开源LCU智能助手的终极配置教程

5分钟掌握League Akari:开源LCU智能助手的终极配置教程 【免费下载链接】League-Toolkit An all-in-one toolkit for LeagueClient. Gathering power 🚀. 项目地址: https://gitcode.com/gh_mirrors/le/League-Toolkit 还在为英雄联盟客户端繁琐的…

作者头像 李华
网站建设 2026/5/11 13:10:31

房屋租赁|房屋出租|房屋租赁系统|基于Springboot的房屋租赁系统设计与实现(源码+数据库+文档)

房屋租赁|房屋出租|房屋租赁系统 目录 基于Springboot的房屋租赁系统设计与实现 一、前言 二、系统功能设计 三、系统实现 1管理员功能实现 2地产公司角色功能 3用户角色功能 四、数据库设计 1、实体ER图 五、核心代码 六、论文参考 七、最新计算机毕设选题推荐 八…

作者头像 李华