news 2026/5/10 2:22:11

华为/HCCL多QP通信阈值配置

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
华为/HCCL多QP通信阈值配置

HCCL_MULTI_QP_THRESHOLD

【免费下载链接】hccl集合通信库(Huawei Collective Communication Library,简称HCCL)是基于昇腾AI处理器的高性能集合通信库,为计算集群提供高性能、高可靠的通信方案项目地址: https://gitcode.com/cann/hccl

功能描述

rank间RDMA通信使用多QP通信的场景下,开发者可通过本环境变量设置每个QP分担数据量的最小阈值。

该环境变量需要配置为整数,取值范围:[1,8192],默认值:512,单位:KB。

  • 如果“(rank间单次通信数据量 / HCCL_RDMA_QPS_PER_CONNECTION的值) < HCCL_MULTI_QP_THRESHOLD的值”,则HCCL执行时会自动减少QP个数,使得每个QP上分担的数据量大于等于HCCL_MULTI_QP_THRESHOLD的值,例如:

    rank间单次通信数据量为1MB,HCCL_RDMA_QPS_PER_CONNECTION配置为4,HCCL_MULTI_QP_THRESHOLD配置为512,此时每个QP最少要求分担512KB的数据量,则HCCL执行时,会减少QP个数为2,仅使用2个QP进行rank间的数据传输。

  • 当rank间数据量小于HCCL_MULTI_QP_THRESHOLD时使用单QP传输。

  • 当每个QP分担的数据量大于512KB时,使用HCCL Test工具进行RDMA流量测试时(仅测试跨机流量,不使用HCCS链路),多QP场景的下发调度开销相对于单QP场景性能劣化小于3%。

[!NOTE]说明 可通过环境变量HCCL_RDMA_QPS_PER_CONNECTION或HCCL_RDMA_QP_PORT_CONFIG_PATH开启多QP通信。

配置示例

export HCCL_MULTI_QP_THRESHOLD=512

使用约束

该环境变量仅支持单算子调用方式,不支持静态图模式。

支持的型号

Atlas A2 训练系列产品/Atlas A2 推理系列产品(针对Atlas A2 训练系列产品/Atlas A2 推理系列产品,仅支持Atlas 800T A2 训练服务器、Atlas 900 A2 PoD 集群基础单元、Atlas 200T A2 Box16 异构子框。)

Atlas A3 训练系列产品/Atlas A3 推理系列产品

【免费下载链接】hccl集合通信库(Huawei Collective Communication Library,简称HCCL)是基于昇腾AI处理器的高性能集合通信库,为计算集群提供高性能、高可靠的通信方案项目地址: https://gitcode.com/cann/hccl

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/10 2:17:53

AI驱动智能交通:从数据融合到智能决策的工程实践

1. 项目概述&#xff1a;当交通系统遇见AI堵在早高峰的车流里&#xff0c;看着纹丝不动的红灯&#xff0c;或者在一个陌生的城市里&#xff0c;被导航导进一条明明显示绿色却实际水泄不通的小路——这些场景&#xff0c;相信每个开车的人都经历过。交通&#xff0c;这个连接城市…

作者头像 李华
网站建设 2026/5/10 2:09:05

混合架构大模型加速:DUET架构的设计与优化

1. 混合架构大模型加速的挑战与机遇在当今大语言模型&#xff08;LLM&#xff09;推理领域&#xff0c;我们面临着一个根本性的性能瓶颈&#xff1a;预填充&#xff08;prefill&#xff09;和解码&#xff08;decode&#xff09;两个阶段的计算特征存在显著差异。预填充阶段需要…

作者头像 李华
网站建设 2026/5/10 2:08:22

基于React的ChatGPT风格AI对话应用UI模板开发指南

1. 项目概述&#xff1a;一个为ChatGPT应用量身定制的UI模板如果你正在开发一个基于ChatGPT或类似大语言模型的Web应用&#xff0c;无论是客服机器人、智能写作助手&#xff0c;还是企业内部的知识问答工具&#xff0c;那么你大概率会遇到一个共同的难题&#xff1a;如何快速搭…

作者头像 李华
网站建设 2026/5/10 2:08:10

Fiduciary AI:构建以用户利益为核心的负责任人工智能系统

1. 项目概述&#xff1a;当AI成为“受托人”最近和几个做金融科技和医疗健康产品的朋友聊天&#xff0c;大家不约而同地提到了同一个焦虑&#xff1a;我们开发的AI系统&#xff0c;决策越来越复杂&#xff0c;影响也越来越大&#xff0c;但怎么确保它真的在为用户的最佳利益服务…

作者头像 李华
网站建设 2026/5/10 2:07:18

cursory:轻量级Web光标样式库的设计原理与工程实践

1. 项目概述&#xff1a;一个为开发者打造的轻量级光标样式库在Web开发中&#xff0c;我们常常会花费大量精力去处理那些“看不见”的细节&#xff0c;比如页面的性能、代码的结构&#xff0c;但有时&#xff0c;一个最直观、最能与用户产生互动的元素——鼠标光标——却容易被…

作者头像 李华