news 2026/6/9 20:57:04

华为昇腾CANN深度学习环境搭建-以搭建VLLM为例

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
华为昇腾CANN深度学习环境搭建-以搭建VLLM为例

1 )首先确定vllm-ascend依赖。

Installation — vllm-ascend

确定cann的版本8.3.rc2

确定vllm和vllm-ascend的对照关系

2) 查询物理机的驱动版本

假设不是cann8.3rc2,那就安装

网址在这里,需要自己注册登录一下:

https://www.hiascend.com/developer/download/community/result?from=firmware&product=1&model=30&cann=8.3.RC2

下载toolkit和 kernels, 我是910b,如果是310请选择对照的版本。

下载完了以后就安装这俩驱动

安装完了以后,再安装一下这几个包,推荐使用conda安装。

pip3 install attrs cython 'numpy>=1.19.2,<=1.24.0' decorator sympy cffi pyyaml pathlib2 psutil protobuf==3.20.0 scipy requests absl-py --user

到这个阶段,驱动安装完了。

3)开始安装torch和torch-npu

这是下载地址:

https://www.hiascend.com/document/detail/zh/Pytorch/720/configandinstg/instg/insg_0004.html

其中8.3rc1和rc2可以通用。

然后安装npu-插件

安装完了以后,测试安装效果

python3 -c "import torch;import torch_npu; a = torch.randn(3, 4).npu(); print(a + a);"

然后安装vllm

安装完了vllm以后呢,torch会被重新装一下,版本可能和你的驱动不搭配。所以

这一步,需要按照第2步重新装一下torch和torch-npu

然后vllm-ascend版本和vllm版本要对照。

然后就结束了。大功告成。

(根据本人的经验,vllm0.11比0.12要快一些。)

4)vllm起量化模型。

vllm serve ./model_path --served-model-name qwen_quant --quantization ascend --max-model-len 90000 --port 8999

访问vllm接口:

为什么要截取90000,因为如果请求超过vllm的max_len 会报错,所以最好限制一下,不要超过vllm起服务时候的最大长度。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/8 7:04:46

Fiddler抓包神器:AI如何帮你自动分析网络请求

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容&#xff1a; 开发一个基于Fiddler的AI辅助分析工具&#xff0c;能够&#xff1a;1. 自动识别和分类常见的API请求模式 2. 根据历史请求智能生成Mock响应数据 3. 检测异常请求和潜在安全问题 4. …

作者头像 李华
网站建设 2026/6/5 20:33:43

Java基础在实际项目中的5个典型应用场景

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容&#xff1a; 开发一个Java实战案例集合应用&#xff0c;包含&#xff1a;1) 文件读写工具演示IO流操作&#xff1b;2) 简易计算器展示GUI事件处理&#xff1b;3) 学生成绩管理系统演示集合框架使…

作者头像 李华
网站建设 2026/6/4 21:43:06

对比:传统安装vsAI辅助获取Jupyter Notebook

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容&#xff1a; 创建一个对比分析工具&#xff0c;能够&#xff1a;1. 记录手动安装Jupyter Notebook的完整步骤和时间&#xff1b;2. 记录使用AI工具自动安装的步骤和时间&#xff1b;3. 生成可视…

作者头像 李华
网站建设 2026/6/9 9:17:09

EmotiVoice与语音唤醒技术结合的智能家居场景设想

EmotiVoice与语音唤醒技术结合的智能家居场景设想 在智能家居设备日益复杂的今天&#xff0c;用户早已不再满足于“能听会说”的机械式语音助手。他们期待的是一个真正懂情绪、有温度、像家人一样自然交流的伙伴。然而现实是&#xff0c;大多数语音系统仍停留在冰冷的标准音输出…

作者头像 李华
网站建设 2026/6/5 19:51:45

CS50 Week 3 Notes

本周主题&#xff1a; 搜索算法&#xff1a;线性搜索&#xff08;Linear Search&#xff09;、二分查找&#xff08;Binary Search&#xff09;排序算法&#xff1a;冒泡排序&#xff08;Bubble Sort&#xff09;、选择排序&#xff08;Selection Sort&#xff09;、归并排序&…

作者头像 李华
网站建设 2026/6/5 18:49:10

AI如何帮你高效使用ctx.drawImage绘制复杂图形

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容&#xff1a; 创建一个使用ctx.drawImage绘制复杂图形的Canvas应用。应用需要包含以下功能&#xff1a;1. 自动生成绘制多张图片的代码&#xff0c;支持图片叠加和位置调整&#xff1b;2. 提供参…

作者头像 李华