CANN/ge LLMDataDist switch_role API指南-洪萨配资

# switch_role

【免费下载链接】geGE（Graph Engine）是面向昇腾的图编译器和执行器，提供了计算图优化、多流并行、内存复用和模型下沉等技术手段，加速模型执行效率，减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力，并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge

产品支持情况

Atlas A3 训练系列产品/Atlas A3 推理系列产品：支持
Atlas A2 推理系列产品：支持
Atlas A2 训练系列产品：不支持

函数功能

切换当前LLMDataDist的角色，建议仅在使用PagedAttention的场景使用。

函数原型

switch_role(self, role: LLMRole, switch_options: Optional[Dict[str, str]] = None)

参数说明

参数名称	数据类型	取值说明
role	LLMRole	切换的目标角色。
switch_options	options: Dict[str, str]	切换角色配置项。可选参数，默认值为None。切换为Prompt时需要设置，其中需包含listen_ip_info配置项。

调用示例

from llm_datadist import LLMDataDist, LLMRole llm_datadist = LLMDataDist(LLMRole.DECODER, 0) ... switch_options = { 'llm.listenIpInfo': '127.0.0.1:26000' } llm_datadist.switch_role(LLMRole.PROMPT, switch_options)

返回值

正常情况下无返回值。
传入数据类型错误情况下会抛出TypeError或ValueError异常。
如果初始化LLMDataDist时LLMConfig未使能enable_switch_role，调用该接口则会抛出LLMException，status_code为LLM_FEATURE_NOT_ENABLED。
如果switch_role时存在残留链路资源，则会抛出LLMException，status_code为LLM_EXIST_LINK。
如果switch_role的目标role与当前role相同，则会抛出LLMException，status_code为LLM_PARAM_INVALID。
单进程多卡模式下，不支持调用该接口。

约束说明

无

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

5个场景解锁Noctalia Shell：从自动化钩子到系统服务深度集成

5个场景解锁Noctalia Shell：从自动化钩子到系统服务深度集成【免费下载链接】noctalia A sleek and minimal desktop shell thoughtfully crafted for Wayland. 项目地址: https://gitcode.com/gh_mirrors/no/noctalia 如果你正在寻找一款能够真正理解Wayla…