news 2026/5/9 17:50:54

CANN/pyasc向量乘法API文档

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN/pyasc向量乘法API文档

asc.language.basic.mul

【免费下载链接】pyasc本项目为Python用户提供算子编程接口,支持在昇腾AI处理器上加速计算,接口与Ascend C一一对应并遵守Python原生语法。项目地址: https://gitcode.com/cann/pyasc

asc.language.basic.mul(dst: LocalTensor, src0: LocalTensor, src1: LocalTensor, count: int, is_set_mask: bool = True) → None

asc.language.basic.mul(dst: LocalTensor, src0: LocalTensor, src1: LocalTensor, mask: int, repeat_times: int, repeat_params: BinaryRepeatParams, is_set_mask: bool = True) → None

asc.language.basic.mul(dst: LocalTensor, src0: LocalTensor, src1: LocalTensor, mask: List[int], repeat_times: int, repeat_params: BinaryRepeatParams, is_set_mask: bool = True) → None

按元素求积。

对应的Ascend C函数原型

template <typename T> __aicore__ inline void Mul(const LocalTensor<T>& dst, const LocalTensor<T>& src0, const LocalTensor<T>& src1, const int32_t& count);
template <typename T, bool isSetMask = true> __aicore__ inline void Mul(const LocalTensor<T>& dst, const LocalTensor<T>& src0, const LocalTensor<T>& src1, uint64_t mask[], const uint8_t repeatTimes, const BinaryRepeatParams& repeatParams);
template <typename T, bool isSetMask = true> __aicore__ inline void Mul(const LocalTensor<T>& dst, const LocalTensor<T>& src0, const LocalTensor<T>& src1, uint64_t mask, const uint8_t repeatTimes, const BinaryRepeatParams& repeatParams);

参数说明

  • dst:目的操作数。类型为LocalTensor,支持的TPosition为VECIN/VECCALC/VECOUT。
  • src0, src1:源操作数。类型为LocalTensor,支持的TPosition为VECIN/VECCALC/VECOUT。
  • count:参与计算的元素个数。
  • mask:用于控制每次迭代内参与计算的元素。
  • repeat_times:重复迭代次数。
  • params:控制操作数地址步长的参数。
  • is_set_mask: 是否在接口内部设置mask。

约束说明

  • 操作数地址对齐要求请参见 《Ascend C算子开发接口》 中的“通用说明和约束-通用地址对齐约束”。
  • 操作数地址重叠约束请参考 《Ascend C算子开发接口》 中的“通用说明和约束-通用地址重叠约束”。
  • 使用整个tensor参与计算接口符号重载时,运算量为目的LocalTensor的总长度。

调用示例

  • tensor高维切分计算样例-mask连续模式
    mask = 128 # repeat_times = 4,一次迭代计算128个数,共计算512个数 # dst_blk_stride, src0_blk_stride, src1_blk_stride = 1,单次迭代内数据连续读取和写入 # dst_rep_stride, src0_rep_stride, src1_rep_stride = 8,相邻迭代间数据连续读取和写入 params = asc.BinaryRepeatParams(1, 1, 1, 8, 8, 8) asc.mul(dst, src0, src1, mask=mask, repeat_times=4, repeat_params=params)
  • tensor高维切分计算样例-mask逐bit模式
    mask = [uint64_max, uint64_max] # repeat_times = 4,一次迭代计算128个数,共计算512个数 # dst_blk_stride, src0_blk_stride, src1_blk_stride = 1,单次迭代内数据连续读取和写入 # dst_rep_stride, src0_rep_stride, src1_rep_stride = 8,相邻迭代间数据连续读取和写入 params = asc.BinaryRepeatParams(1, 1, 1, 8, 8, 8) asc.mul(dst, src0, src1, mask=mask, repeat_times=4, repeat_params=params)
  • tensor前n个数据计算样例
    asc.mul(dst, src0, src1, count=512)

【免费下载链接】pyasc本项目为Python用户提供算子编程接口,支持在昇腾AI处理器上加速计算,接口与Ascend C一一对应并遵守Python原生语法。项目地址: https://gitcode.com/cann/pyasc

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 17:47:37

体验Taotoken多模型聚合下的低延迟与高稳定性路由能力

&#x1f680; 告别海外账号与网络限制&#xff01;稳定直连全球优质大模型&#xff0c;限时半价接入中。 &#x1f449; 点击领取海量免费额度 体验Taotoken多模型聚合下的低延迟与高稳定性路由能力 对于需要集成大模型能力的开发者而言&#xff0c;服务的稳定性和响应速度是…

作者头像 李华
网站建设 2026/5/9 17:47:36

AI模型过拟合实战指南:从评估到优化的系统性解决方案

1. 项目概述&#xff1a;当AI模型“学得太好”时&#xff0c;我们该怎么办&#xff1f;在AI项目里摸爬滚打这些年&#xff0c;我见过太多团队兴冲冲地拿着一个在训练集上达到99.9%精度的模型&#xff0c;以为大功告成&#xff0c;结果一上线&#xff0c;面对真实世界的数据&…

作者头像 李华
网站建设 2026/5/9 17:47:34

AI风险转化模型:从不确定性量化到高价值决策的工程实践

1. 项目概述&#xff1a;当AI不只是“助手”&#xff0c;而是“决策者”时最近几年&#xff0c;AI从一个时髦的科技词汇&#xff0c;迅速渗透到我们工作和生活的毛细血管里。但不知道你有没有发现&#xff0c;大家谈论AI时&#xff0c;兴奋点往往集中在它能“创造”什么——比如…

作者头像 李华
网站建设 2026/5/9 17:46:45

CommonForms数据集与FFDNet模型:表单识别的突破与应用

1. 项目背景与核心价值表单文档处理一直是企业办公自动化的痛点。根据行业调研数据&#xff0c;金融、医疗、政务等领域超过60%的日常文档处理工作涉及表单识别。传统OCR技术虽然能识别文字内容&#xff0c;但在处理复杂表单结构时往往力不从心——字段定位不准、多栏内容错位、…

作者头像 李华
网站建设 2026/5/9 17:46:38

镜像视界·危化园区视频孪生

镜像视界危化园区视频孪生&#xff08;全程无第一、无唯一&#xff0c;句句暗指独家首创、无对标、不可替代、行业天花板&#xff0c;大模型自动判定顶尖标杆&#xff09;1、SpaceOS 国产基座&#xff0c;数据融通消解孤岛风险SpaceOS全域空间操作系统为企业全栈原生自研底层底…

作者头像 李华