news 2026/5/10 0:44:11

CANN/hcomm梯度切分策略设置

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN/hcomm梯度切分策略设置

set_split_strategy_by_size

【免费下载链接】hcommHCOMM(Huawei Communication)是HCCL的通信基础库,提供通信域以及通信资源的管理能力。项目地址: https://gitcode.com/cann/hcomm

产品支持情况

  • Ascend 950PR/Ascend 950DT:支持
  • Atlas A3 训练系列产品/Atlas A3 推理系列产品:支持
  • Atlas A2 训练系列产品/Atlas A2 推理系列产品:支持
  • Atlas 推理系列产品:支持
  • Atlas 训练系列产品:支持

[!NOTE]说明 针对Atlas A2 训练系列产品/Atlas A2 推理系列产品,仅支持Atlas 800T A2 训练服务器、Atlas 900 A2 PoD 集群基础单元、Atlas 200T A2 Box16 异构子框。 针对Atlas 推理系列产品,仅支持Atlas 300I Duo 推理卡。

功能说明

基于梯度数据量百分比,在集合通信group内设置反向梯度切分策略,实现allreduce的融合,用于进行集合通信的性能调优。

函数原型

def set_split_strategy_by_size(dataSizeList, group="hccl_world_group")

参数说明

参数名输入/输出描述
dataSizeList输入list类型。
梯度参数数据量百分比列表。
- 梯度的索引id列表需为非负,且梯度数据量序列总百分比之和必须为100。
- 梯度的切分最多支持8段。
- 比如模型总共有150M梯度数据量,需要切分90M,30M,30M三段,则可以设置dataSizeList =[60,20,20]。
group输入String类型,最大长度为128字节,含结束符。
group名称,可以为"hccl_world_group"或自定义group,默认为"hccl_world_group"。

返回值

无。

约束说明

  • 调用该接口的rank必须在当前接口入参group定义的范围内,不在此范围内的rank调用该接口会失败。

  • 在同时基于梯度数据量百分比及梯度的索引id设置反向梯度切分策略时,以基于梯度数据量百分比设置结果优先。

  • 若用户不调用梯度切分接口设置切分策略,则会按默认反向梯度切分策略切分。

    默认切分策略:ResNet50的最优切分位置,即按梯度数据量切分为2段,第一段数据量为96.54%,第二段数据量为3.46%。

调用示例

from hccl.split.api import * set_split_strategy_by_size([60, 20, 20], "group")

【免费下载链接】hcommHCOMM(Huawei Communication)是HCCL的通信基础库,提供通信域以及通信资源的管理能力。项目地址: https://gitcode.com/cann/hcomm

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/10 0:38:37

Pyroclast框架:地球动力学模拟的高性能Python解决方案

1. Pyroclast框架设计理念与技术突破地球动力学模拟长期面临一个根本性矛盾:一方面需要处理极端非线性的物理过程(如岩石的粘弹塑性变形),另一方面又受限于传统Fortran/C代码的扩展瓶颈。Pyroclast的诞生正是为了解决这一矛盾&…

作者头像 李华
网站建设 2026/5/10 0:37:34

阿里云大数据技能包:让AI智能体安全高效操作DataWorks等云服务

1. 项目概述:为AI智能体注入阿里云大数据操作能力 如果你正在探索如何让AI智能体(比如Claude、GPTs或者基于LangChain构建的助手)真正“上手”操作阿里云上的大数据服务,那么你很可能已经发现了一个核心痛点:这些服务…

作者头像 李华
网站建设 2026/5/10 0:35:41

为OpenClaw智能体工作流配置Taotoken作为可靠模型供应商

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 为OpenClaw智能体工作流配置Taotoken作为可靠模型供应商 在构建基于OpenClaw的智能体工作流时,一个稳定、可管理的模型…

作者头像 李华
网站建设 2026/5/10 0:32:44

BFS解力扣1654最短跳跃次数

对于 LeetCode 1654 “到家的最少跳跃次数”这道题,核心是使用广度优先搜索 (BFS) 来寻找从起点 0 到目标位置 x 的最短路径。解题的关键在于对搜索空间进行合理的限制,并正确处理“不能连续向后跳”的约束。 问题解构与约束分析 约束条件说明跳跃规则…

作者头像 李华
网站建设 2026/5/10 0:31:28

Rainy MaTE:基于Rust与Tauri的本地优先AI代理开发平台深度解析

1. 项目概述:一个为开发者设计的本地优先AI代理驾驶舱如果你和我一样,对市面上那些要么完全在云端黑箱运行、要么权限管理松散的AI代理工具感到不安,同时又渴望一个能在自己电脑上真正“干活”的智能助手,那么Rainy MaTE的出现绝对…

作者头像 李华
网站建设 2026/5/10 0:30:55

AI文化遗产保护:应对数据偏见与构建公平数字化框架

1. 项目概述:当AI遇见非洲文化,一场关于“看见”与“被看见”的数字对话最近几年,我参与和观察了不少利用人工智能进行文化遗产数字化的项目,从欧洲的博物馆到亚洲的古迹,技术方案日趋成熟。但当我将目光投向非洲大陆时…

作者头像 李华