news 2026/5/9 12:18:30

CANN/pyasc多核同步接口文档

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN/pyasc多核同步接口文档

asc.language.basic.notify_next_block

【免费下载链接】pyasc本项目为Python用户提供算子编程接口,支持在昇腾AI处理器上加速计算,接口与Ascend C一一对应并遵守Python原生语法。项目地址: https://gitcode.com/cann/pyasc

asc.language.basic.notify_next_block(gm_workspace: GlobalTensor, ub_workspace: LocalTensor) → None

多核同步接口,通过写入 Global Memory 中的标志位,通知下一个 AI Core 当前核的操作已完成。

此接口通常与 wait_pre_block 配对使用。当前核调用此函数后,等待此核的下一个核将能够通过 wait_pre_block 检测到状态变化,从而继续执行。

对应的Ascend C函数原型

__aicore__ inline void NotifyNextBlock(GlobalTensor<int32_t>& gmWorkspace, LocalTensor<int32_t>& ubWorkspace)

参数说明

  • gm_workspace (asc.GlobalTensor): Global Memory 上的临时工作空间。 : - 用于核间通信的共享内存区域。通过向此空间写入一个特定的标志位,来通知下一个核。
    • 类型必须为 GlobalTensor<int32_t>。
  • ub_workspace (asc.LocalTensor): UB 上的临时工作空间。 : - 用于在 AI Core 内部操作 gm_workspace 的暂存区。
    • 类型必须为 LocalTensor<int32_t>。

返回值

无。

约束说明

  • 需要保证每个核调用该接口的次数相同。
  • gm_workspace申请的空间最少要求为:blockNum * 32Bytes;ub_workspace申请的空间最少要求为:blockNum * 32 + 32Bytes;其中blockNum为调用的核数,可调用get_block_num获取。
  • 分离模式下,使用该接口进行多核同步时,仅对AIV核生效,wait_pre_block和notify_next_block之间仅支持插入矢量计算相关指令,对矩阵计算相关指令不生效。
  • 使用该接口进行多核控制时,算子调用时指定的逻辑blockNum必须保证不大于实际运行该算子的AI处理器核数,否则框架进行多轮调度时会插入异常同步,导致Kernel“卡死”现象。

调用示例

asc.notify_next_block(gm_workspace, ub_workspace)

【免费下载链接】pyasc本项目为Python用户提供算子编程接口,支持在昇腾AI处理器上加速计算,接口与Ascend C一一对应并遵守Python原生语法。项目地址: https://gitcode.com/cann/pyasc

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 12:12:48

使用Taotoken CLI工具一键配置团队开发环境的最佳实践

&#x1f680; 告别海外账号与网络限制&#xff01;稳定直连全球优质大模型&#xff0c;限时半价接入中。 &#x1f449; 点击领取海量免费额度 使用Taotoken CLI工具一键配置团队开发环境的最佳实践 为团队统一接入大模型服务时&#xff0c;配置的分散和差异常常是效率的瓶颈…

作者头像 李华
网站建设 2026/5/9 12:12:28

AI Agent框架实战:从零构建可编程AI秘书,实现自动化工作流

1. 项目概述&#xff1a;当AI成为你的专属秘书最近在GitHub上看到一个挺有意思的项目&#xff0c;叫razbakov/ai-secretary。光看名字&#xff0c;你可能会觉得这又是一个“AI写邮件”或者“智能日程管理”的玩具。但当我真正深入去研究它的代码和设计理念后&#xff0c;发现它…

作者头像 李华
网站建设 2026/5/9 12:10:32

Alpamayo-R1 智能驾驶VLA大模型昇腾A2平台使用指南

Alpamayo-R1 智能驾驶VLA大模型昇腾A2平台使用指南 【免费下载链接】cann-recipes-embodied-intelligence 本项目针对具身智能业务中的典型模型、加速算法&#xff0c;提供基于CANN平台的优化样例 项目地址: https://gitcode.com/cann/cann-recipes-embodied-intelligence …

作者头像 李华
网站建设 2026/5/9 12:05:31

CANNBot内核调试指南

Kernel Debugging Playbook 【免费下载链接】cannbot-skills CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体&#xff0c;本仓库为其提供可复用的 Skills 模块。 项目地址: https://gitcode.com/cann/cannbot-skills Use this playbook when an existing kern…

作者头像 李华
网站建设 2026/5/9 12:03:31

终极鼠标性能测试指南:3步精准评估您的设备表现

终极鼠标性能测试指南&#xff1a;3步精准评估您的设备表现 【免费下载链接】MouseTester 项目地址: https://gitcode.com/gh_mirrors/mo/MouseTester 想要知道您的鼠标是否真的物有所值&#xff1f;MouseTester——这款专业级鼠标性能测试工具&#xff0c;为您提供精确…

作者头像 李华
网站建设 2026/5/9 12:00:36

CANN学习中心仓技能集合

Skills - CANNBot 技能集合 【免费下载链接】cann-learning-hub CANN 学习中心仓&#xff0c;支持在线互动运行、边学边练&#xff0c;提供教程、示例与优化方案&#xff0c;一站式助力昇腾开发者快速上手。 项目地址: https://gitcode.com/cann/cann-learning-hub 本目…

作者头像 李华