news 2026/5/9 18:03:31

CANN ascend-transformer-boost aclnn与ATB算子混搭示例

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN ascend-transformer-boost aclnn与ATB算子混搭示例

aclnnPluginOperation与ATBOperation混搭组图示例

【免费下载链接】ascend-transformer-boost本项目是CANN提供的是一款高效、可靠的Transformer加速库,基于华为Ascend AI处理器,提供Transformer定制化场景的高性能融合算子。项目地址: https://gitcode.com/cann/ascend-transformer-boost

介绍

本用例为aclnnPluginOperation与ATBOperation混搭组图的运行示例,该用例整体分为五个部分:aclnn算子部分、ATB算子部分、model部分、基础设施部分、主函数。

  • aclnn算子部分:实现了aclnn算子对ATB的接入。
  • ATB算子部分:使用ATB原生算子构建了一个ATB图算子。
  • model部分:主要使用了ATB算子部分与aclnn算子部分生成的算子构建了一个更大的图算子,并且包含ATB图算子相关的调用逻辑。
  • 基础设施部分:主要包含日志与内存池,用于辅助问题定位及加快显存分配速度。
  • 主函数部分:承载着程序入口的功能,同时多线程功能也在主函数中实现。

用例运行

  • 进入到atb-aclnn目录下:

    cd ${用例所在目录}/atb-aclnn
  • 设置CANN环境变量(如source /usr/local/Ascend/ascend-toolkit/set_env.sh):

    source ${toolkit安装目录}/set_env.sh
  • 设置ATB环境变量(如source /usr/local/Ascend/nnal/atb/set_env.sh):

    source ${nnal安装目录}/atb/set_env.sh
  • 执行build.sh脚本:

    bash ./build.sh
  • 执行用例:

    ./build/test_model

说明

  • 当前用例根据物理机上的device卡数创建线程,若需要调整线程个数,请自行修改main.cpp中的线程创建个数。

  • 保证demo的ABI版本与ATB一致。ATB的abi版本的查看方法:

    env | grep ATB_HOME_PATH

    demo的ABI版本查看方法:通过查看CMakeList中的如下命令来查看ABI版本为0或1,OFF表示0,ON表示1。下面的代码则表示ABI版本为0。

    option(USE_CXX11_ABI "USE_CXX11_ABI" OFF)

【免费下载链接】ascend-transformer-boost本项目是CANN提供的是一款高效、可靠的Transformer加速库,基于华为Ascend AI处理器,提供Transformer定制化场景的高性能融合算子。项目地址: https://gitcode.com/cann/ascend-transformer-boost

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 18:00:49

终极指南:3步实现微信平板模式,打破手机登录限制

终极指南:3步实现微信平板模式,打破手机登录限制 【免费下载链接】WeChatPad 强制使用微信平板模式 项目地址: https://gitcode.com/gh_mirrors/we/WeChatPad 你是否厌倦了在手机和平板之间来回切换微信账号?想要同时登录工作和生活微…

作者头像 李华
网站建设 2026/5/9 17:57:53

ChatGPT教育应用研究:揭示AI学习能力构建与课堂整合路径

1. 项目概述:当ChatGPT走进课堂,我们真的准备好了吗?作为一名在教育技术和一线教学实践里摸爬滚打了十多年的从业者,我亲眼见证了从多媒体课件到在线学习平台,再到如今AI浪潮席卷课堂的每一次技术变迁。最近&#xff0…

作者头像 李华
网站建设 2026/5/9 17:57:48

Mem0开源项目:为AI智能体构建长期记忆系统的架构与实践

1. 项目概述:为AI智能体构建一个“长期记忆”系统 如果你正在开发一个AI助手、客服机器人或者任何需要与用户进行多轮对话的智能体,你肯定遇到过这个经典难题: 对话没有连续性 。用户今天告诉你他喜欢喝美式咖啡,明天再聊起咖啡…

作者头像 李华
网站建设 2026/5/9 17:56:56

CANN/torchtitan-npu云平台开发指南

Qwen3-0.6B 单机样例(云开发平台) 【免费下载链接】torchtitan-npu Ascend Extension for torchtitan 项目地址: https://gitcode.com/cann/torchtitan-npu 本文档给出 torchtitan_npu/models/qwen3 在云开发平台上的最小可运行样例,默…

作者头像 李华
网站建设 2026/5/9 17:56:01

linux学习进展 mysql索引详解

一、索引基础认知 1. 什么是索引 索引是 MySQL 中一种特殊的数据结构(类似书籍的目录),存储在表空间(.ibd文件)中,用于快速定位数据,避免全表扫描。简单说:无索引→逐行扫全表&…

作者头像 李华