# switch_role
【免费下载链接】geGE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效率,减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力,并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge
产品支持情况
- Atlas A3 训练系列产品/Atlas A3 推理系列产品:支持
- Atlas A2 推理系列产品:支持
- Atlas A2 训练系列产品:不支持
函数功能
切换当前LLMDataDist的角色,建议仅在使用PagedAttention的场景使用。
函数原型
switch_role(self, role: LLMRole, switch_options: Optional[Dict[str, str]] = None)参数说明
| 参数名称 | 数据类型 | 取值说明 |
|---|---|---|
| role | LLMRole | 切换的目标角色。 |
| switch_options | options: Dict[str, str] | 切换角色配置项。 可选参数,默认值为None。 切换为Prompt时需要设置,其中需包含listen_ip_info配置项。 |
调用示例
from llm_datadist import LLMDataDist, LLMRole llm_datadist = LLMDataDist(LLMRole.DECODER, 0) ... switch_options = { 'llm.listenIpInfo': '127.0.0.1:26000' } llm_datadist.switch_role(LLMRole.PROMPT, switch_options)返回值
- 正常情况下无返回值。
- 传入数据类型错误情况下会抛出TypeError或ValueError异常。
- 如果初始化LLMDataDist时LLMConfig未使能enable_switch_role,调用该接口则会抛出LLMException,status_code为LLM_FEATURE_NOT_ENABLED。
- 如果switch_role时存在残留链路资源,则会抛出LLMException,status_code为LLM_EXIST_LINK。
- 如果switch_role的目标role与当前role相同,则会抛出LLMException,status_code为LLM_PARAM_INVALID。
- 单进程多卡模式下,不支持调用该接口。
约束说明
无
【免费下载链接】geGE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效率,减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力,并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考