news 2026/6/19 19:01:21

反讽环境安装

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
反讽环境安装

云平台

租一台新的机子,4b模型跑在5090显卡上,可以选西北的机子,如果不想重新租也可以直接重置之前的机子
ps:不要选重庆的机子,因为之后好像端口映射不了。

这里选镜像的时候选如下就行

虚拟环境激活

开机后用ssh工具连接(只要能来连接ssh就可以,推荐xterminal)

连接到云服务器

在root目录下有个autodl-tmp,把所有重要数据都存在这个目录,避免关机重启被清除

启动后按照如下命令配置uv虚拟环境

pip install uv #先安装uv第三方库 cd /root/autodl-tmp #进入目录 mkdir Qwen #创建名叫Qwen文件夹 uv venv --python 3.12 #创建uv虚拟环境,并且指定python版本 source .venv/bin/activate #激活虚拟环境

激活后最前面有个qwen标识,代表已经进入虚拟环境

模型下载

进入虚拟环境后,先安装modelscope库,用来拉取模型

uv pip install modelscope #在uv环境中安装modelscope
modelscope download --model Qwen/Qwen3.5-4B #使用modelscope库下载模型文件

这里下载可能需要十分钟左右

因为下载路径未指定,所以应该是modelscope的默认路径:/root/.cache/modelscope/hub/models/Qwen/Qwen3.5-4B,下载成功后会在这个路径下存放所有的模型文件,需要把所有模型文件拷贝到/root/autodl-tmp/Qwen目录下,防止丢失

vllm推理器下载

下图是魔搭社区中关于vllm的官方下载方式,但是我试过了,不行,因为它默认下载最新版,和云服务器显卡以及cuda驱动之间可能存在冲突,需要下载指定版本0.18.1

uv pip istall vllm==0.18.1 --index-url https://mirrors.aliyun.com/pypi/simple/ #使用aliyun加速

这边下载也要十分钟左右

启动模型

VLLM_USE_MODELSCOPE=true vllm serve /root/autodl-tmp/Qwen/Qwen35-4B --port 6006 --tensor-parallel-size 1 --max-model-len 262144 --language-model-only #将服务开放在6006端口,/root/autodl-tmp/Qwen/Qwen35-4B这个路径就是存放模型的路径,之后调用代码里面需要和这里保持一致

第一次启动可能慢点,大概需要七八分钟,之后启动会快很多

出现如上界面代表启动成功,此时已经可以调用api服务了

autodl云平台会自动把内网的6006服务映射到公网上,如下图所示,调用代码中只需要将此链接复制就可以批量调用模型服务

关闭模型服务,只需要ctrl+C中断服务即可

脚本

因为是在云服务器上,所以不用的时候需要关机,所以下次启动的时候又需要重新进入虚拟环境,激活,然后再启动模型,比较繁琐

可以写一个bash脚本来一键启动,复制如下命令到start.sh

chmod +x start.sh(赋予脚本可执行的权限)

#!/bin/bash cd /root/autodl-tmp/Qwen source .venv/bin/activate VLLM_USE_MODELSCOPE=true vllm serve /root/autodl-tmp/CoASD \ #这里启动的模型是 --port 6006\ --tensor-parallel-size 1 \ --max-model-len 262144 \ --reasoning-parser qwen3 \ --language-model-only

以后每次启动模型./start.sh即可启动

微调

这部分写期刊论文应该用不到,期刊论文就聚焦多智能体,把多智能体模型讲得高大上一点就行,不需要微调

但之后做其他项目可以尝试微调,所以这边还是写了一下。

安装步骤:

微调采用llamafactory平台,可以再建一个虚拟环境,避免各种库的版本冲突

cd /root/autodl-tmp mkdir llama uv venv source .venv/bin/activate

之后安装都在虚拟环境中实现即可

安装教程参照:

LLaMA-Factory安装教程(详细版)_llamafactory安装-CSDN博客

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/19 19:00:30

OpenVINS初始化策略解析:从静态校准到动态恢复

1. OpenVINS初始化:为什么它如此重要? 想象一下你第一次使用手机导航,如果GPS一开始就把你的位置定位在隔壁城市,后续再怎么修正都会跑偏。视觉惯性导航系统(VINS)同样面临这个问题——初始化阶段哪怕微小的…

作者头像 李华
网站建设 2026/6/19 18:30:21

Windows防撤回神器:3分钟解锁微信/QQ消息完整查看权限

Windows防撤回神器:3分钟解锁微信/QQ消息完整查看权限 【免费下载链接】RevokeMsgPatcher :trollface: A hex editor for WeChat/QQ/TIM - PC版微信/QQ/TIM防撤回补丁(我已经看到了,撤回也没用了) 项目地址: https://gitcode.co…

作者头像 李华
网站建设 2026/6/19 18:25:28

死锁分析进阶:从日志到根因,一次搞定死锁排查

​关键词​:死锁;InnoDB;锁等待;间隙锁;死锁日志;死锁预防 大家好,我是小耶,写功课只是为了我踩过的坑,你们别再踩了! 半夜两点,手机响了。钉钉群…

作者头像 李华
网站建设 2026/6/19 18:20:58

MC68HC908JG16系统模块深度解析:SIM、MON与TIM实战指南

1. 项目概述:深入MCU的“神经中枢”与“后门”在嵌入式开发的世界里,尤其是面对像MC68HC908JG16这类经典的8位微控制器,很多开发者往往把精力集中在应用层的逻辑实现上,比如驱动外设、处理数据流。然而,真正决定一个系…

作者头像 李华
网站建设 2026/6/19 18:19:23

3D拓扑优化技术在宽带闪耀超表面设计中的应用

1. 宽带闪耀超表面设计中的3D拓扑优化技术解析在光学器件设计领域,传统闪耀光栅长期受限于锯齿状轮廓的加工难度和带宽性能瓶颈。我们团队最近成功将3D拓扑优化技术应用于宽带闪耀超表面设计,通过有限元建模与伴随灵敏度分析的创新组合,实现了…

作者头像 李华