news 2026/7/4 7:41:13

CANN/ge LLMDataDist switch_role API指南

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN/ge LLMDataDist switch_role API指南

# switch_role

【免费下载链接】geGE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效率,减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力,并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge

产品支持情况

  • Atlas A3 训练系列产品/Atlas A3 推理系列产品:支持
  • Atlas A2 推理系列产品:支持
  • Atlas A2 训练系列产品:不支持

函数功能

切换当前LLMDataDist的角色,建议仅在使用PagedAttention的场景使用。

函数原型

switch_role(self, role: LLMRole, switch_options: Optional[Dict[str, str]] = None)

参数说明

参数名称数据类型取值说明
roleLLMRole切换的目标角色。
switch_optionsoptions: Dict[str, str]切换角色配置项。
可选参数,默认值为None。
切换为Prompt时需要设置,其中需包含listen_ip_info配置项。

调用示例

from llm_datadist import LLMDataDist, LLMRole llm_datadist = LLMDataDist(LLMRole.DECODER, 0) ... switch_options = { 'llm.listenIpInfo': '127.0.0.1:26000' } llm_datadist.switch_role(LLMRole.PROMPT, switch_options)

返回值

  • 正常情况下无返回值。
  • 传入数据类型错误情况下会抛出TypeError或ValueError异常。
  • 如果初始化LLMDataDist时LLMConfig未使能enable_switch_role,调用该接口则会抛出LLMException,status_code为LLM_FEATURE_NOT_ENABLED。
  • 如果switch_role时存在残留链路资源,则会抛出LLMException,status_code为LLM_EXIST_LINK。
  • 如果switch_role的目标role与当前role相同,则会抛出LLMException,status_code为LLM_PARAM_INVALID。
  • 单进程多卡模式下,不支持调用该接口。

约束说明

【免费下载链接】geGE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效率,减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力,并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/7/4 7:40:43

5个场景解锁Noctalia Shell:从自动化钩子到系统服务深度集成

5个场景解锁Noctalia Shell:从自动化钩子到系统服务深度集成 【免费下载链接】noctalia A sleek and minimal desktop shell thoughtfully crafted for Wayland. 项目地址: https://gitcode.com/gh_mirrors/no/noctalia 如果你正在寻找一款能够真正理解Wayla…

作者头像 李华
网站建设 2026/7/4 7:40:33

专业级网络安全数据处理工具:CyberChef实战指南

专业级网络安全数据处理工具:CyberChef实战指南 【免费下载链接】CyberChef The Cyber Swiss Army Knife - a web app for encryption, encoding, compression and data analysis 项目地址: https://gitcode.com/GitHub_Trending/cy/CyberChef CyberChef是一…

作者头像 李华
网站建设 2026/7/4 7:39:46

CANN/ge异步KV缓存传输API

# transfer_cache_async 【免费下载链接】ge GE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效率,减少模型内存占用。 GE 提供对…

作者头像 李华
网站建设 2026/7/4 7:39:21

5步构建你的专属音乐宇宙:洛雪音乐音源配置完全指南

5步构建你的专属音乐宇宙:洛雪音乐音源配置完全指南 【免费下载链接】lxmusic- lxmusic(洛雪音乐)全网最新最全音源 项目地址: https://gitcode.com/gh_mirrors/lx/lxmusic- 你是否厌倦了在不同音乐平台间来回切换?是否受够了某些歌曲只能在特定平…

作者头像 李华
网站建设 2026/7/4 7:36:24

如何在电脑上免费玩Switch游戏:yuzu模拟器完整指南

如何在电脑上免费玩Switch游戏:yuzu模拟器完整指南 【免费下载链接】yuzu 任天堂 Switch 模拟器 项目地址: https://gitcode.com/GitHub_Trending/yu/yuzu 想在电脑上体验《塞尔达传说:旷野之息》的壮丽世界吗?或者想在PC上和朋友一起…

作者头像 李华