news 2026/5/11 13:45:31

CANN/asc-devkit asc_duplicate函数

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN/asc-devkit asc_duplicate函数

asc_duplicate

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT

功能说明

根据mask将源操作数src的最低位元素填充到目的操作数dst。

计算公式如下:

$$ dst_i = src_0 $$

函数原型

__simd_callee__ inline void asc_duplicate(vector_uint8_t& dst, vector_uint8_t src, vector_bool mask) __simd_callee__ inline void asc_duplicate(vector_int8_t& dst, vector_int8_t src, vector_bool mask) __simd_callee__ inline void asc_duplicate(vector_fp8_e4m3fn_t& dst, vector_fp8_e4m3fn_t src, vector_bool mask) __simd_callee__ inline void asc_duplicate(vector_fp8_e5m2_t& dst, vector_fp8_e5m2_t src, vector_bool mask) __simd_callee__ inline void asc_duplicate(vector_uint16_t& dst, vector_uint16_t src, vector_bool mask) __simd_callee__ inline void asc_duplicate(vector_int16_t& dst, vector_int16_t src, vector_bool mask) __simd_callee__ inline void asc_duplicate(vector_half& dst, vector_half src, vector_bool mask) __simd_callee__ inline void asc_duplicate(vector_bfloat16_t& dst, vector_bfloat16_t src, vector_bool mask) __simd_callee__ inline void asc_duplicate(vector_uint32_t& dst, vector_uint32_t src, vector_bool mask) __simd_callee__ inline void asc_duplicate(vector_int32_t& dst, vector_int32_t src, vector_bool mask) __simd_callee__ inline void asc_duplicate(vector_float& dst, vector_float src, vector_bool mask)

参数说明

参数名输入/输出描述
dst输出目的操作数(矢量数据寄存器)。
src输入源操作数(矢量数据寄存器)。
mask输入源操作数掩码(掩码寄存器)。用于指示在计算过程中哪些元素参与计算。对应位置为1时参与计算,为0时不参与计算。mask未筛选的元素在输出中置零。

矢量数据寄存器和掩码寄存器的详细说明请参见reg数据类型定义.md。

返回值说明

流水类型

PIPE_V

约束说明

调用示例

vector_half dst; vector_half src; vector_bool mask = asc_create_mask_b16(PAT_ALL); asc_loadalign(src, src_addr); // src_addr是外部输入的UB内存空间地址。 asc_duplicate(dst, src, mask);

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/11 13:43:14

029删除链表的倒数第N个结点

删除链表的倒数第N个结点 题目链接:https://leetcode.cn/problems/remove-nth-node-from-end-of-list/description/?envTypestudy-plan-v2&envIdtop-100-liked 我的解答: //方法一:遍历两遍 //时间复杂度:O(L) //空间复杂度&…

作者头像 李华
网站建设 2026/5/11 13:42:33

PyCharm配置PyQt5开发环境:一站式集成Qt Designer、PyUIC与PyRcc实战指南

1. 环境准备与基础安装 第一次用PyCharm搞PyQt5开发时,我对着满屏的英文文档差点放弃。后来发现只要搞定这三个核心工具链——Qt Designer画界面、PyUIC转代码、PyRcc管资源,开发效率能翻倍。先说最基础的安装,别被那些复杂的配置吓到&#x…

作者头像 李华
网站建设 2026/5/11 13:41:56

终极显卡驱动清理指南:如何使用DDU解决驱动冲突问题

终极显卡驱动清理指南:如何使用DDU解决驱动冲突问题 【免费下载链接】display-drivers-uninstaller Display Driver Uninstaller (DDU) a driver removal utility / cleaner utility 项目地址: https://gitcode.com/gh_mirrors/di/display-drivers-uninstaller …

作者头像 李华
网站建设 2026/5/11 13:35:54

PagePlug核心功能深度解析:可视化建模与API集成完整指南

PagePlug核心功能深度解析:可视化建模与API集成完整指南 【免费下载链接】pageplug PagePlug是 Appsmith 的中国化项目,基于Appsmith做了整体性能的优化及汉化,也集合了特色表单解决方案Formily组件、图表解决方案Echarts组件、低代码小程序开…

作者头像 李华