news 2026/5/5 6:49:40

ModelScope(魔搭)下载模型通过 vLLM 启动服务,并开放端口给 Windows 访问

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
ModelScope(魔搭)下载模型通过 vLLM 启动服务,并开放端口给 Windows 访问
source ~/vllm-env/bin/activate # 基础依赖 pip install modelscope vllm
import os from modelscope import snapshot_download # ====================== # 配置模型 # ====================== LLM_MODEL = "Qwen/Qwen2.5-0.5B" VLM_MODEL = "OpenBMB/MiniCPM-V-2_6-int4" # 或 MiniCPM-V-2_6(非量化) LLM_DIR = f"./models/{LLM_MODEL.replace('/', '_')}" VLM_DIR = f"./models/{VLM_MODEL.replace('/', '_')}" # ====================== # 下载模型(ModelScope) # ====================== for name, path in [(LLM_MODEL, LLM_DIR), (VLM_MODEL, VLM_DIR)]: if not os.path.exists(path) or not os.listdir(path): print(f"📥 下载模型: {name}") os.makedirs(path, exist_ok=True) snapshot_download(model_id=name, local_dir=path) else: print(f"✅ 模型已存在: {path}") # ====================== # 启动服务 # ====================== print("\n🚀 启动 LLM 服务 (端口 8000)...") llm_cmd = ( f"python -m vllm.entrypoints.openai.api_server " f"--model {LLM_DIR} " f"--host 0.0.0.0 --port 8000 " f"--dtype bfloat16" ) print("🚀 启动 VLM 服务 (端口 8001)...") vlm_cmd = ( f"python -m vllm.entrypoints.openai.api_server " f"--model {VLM_DIR} " f"--host 0.0.0.0 --port 8001 " f"--dtype bfloat16 " f"--trust-remote-code" # ⚠️ 关键参数! ) print("\n🌐 访问地址:") print(f" - LLM: http://localhost:8000/v1") print(f" - VLM: http://localhost:8001/v1") # 后台启动 VLM,前台运行 LLM os.system(f"nohup {vlm_cmd} > vlm.log 2>&1 &") os.system(llm_cmd)
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/5 8:19:42

大模型知识增强指南:RAG与微调的优劣势对比与场景选择

文章对比分析了两种大模型知识增强方法:RAG通过检索用户文档库让模型基于特定资料作答,解决知识接入问题;微调则在模型内部写入专业知识,增强垂直领域能力并固化行为。RAG成本低、操作简单,适合个人用户;微…

作者头像 李华
网站建设 2026/5/5 8:19:48

A2A 协议的工作流程是怎样的?

A2A(Agent-to-Agent)协议是一种用于智能代理之间通信和协作的协议。以下是A2A协议的典型工作流程: A2A协议工作流程 1. 初始化阶段 代理注册:各个代理向A2A注册中心注册自己的能力、服务类型和通信地址能力发现:代理查…

作者头像 李华
网站建设 2026/5/5 8:18:36

大模型训练三阶段完全指南:从预训练到对齐,一文掌握GPT/LLaMA等模型训练流程(建议收藏)

大模型训练分为预训练、微调和对齐三阶段。预训练阶段使用TB级数据学习通用语言能力;微调阶段通过GB级高质量数据增强特定任务能力;对齐阶段确保输出符合人类价值观,采用3H原则。这三个阶段从知识基础、任务适配到价值对齐,共同构…

作者头像 李华
网站建设 2026/5/5 8:19:42

从传统AI到 Agentic AI:教育技术中,提示工程架构师的转型之路!

从传统AI到Agentic AI:教育技术中,提示工程架构师的转型之路 一、引言:当“机械导师”遇到“主动学习者” 你是否见过这样的场景? 一个学生用某款英语背单词APP,连续3天收到“abandon”的复习提醒——哪怕他早就把这…

作者头像 李华
网站建设 2026/5/3 13:34:00

论文开题不再愁!书匠策AI:你的学术“开题神器”

在学术研究的漫漫征途中,论文开题报告就像是一座灯塔,为我们指引着研究方向。它不仅是对研究项目的初步规划,更是向评审专家展示研究价值与可行性的重要窗口。然而,对于许多研究者,尤其是初涉学术领域的新手来说&#…

作者头像 李华
网站建设 2026/5/3 1:14:13

python + vue 健康饮食食材烹饪管理系统vue3

目录健康饮食食材烹饪管理系统(Python Vue3)摘要系统概述技术栈核心功能扩展性应用场景项目技术支持可定制开发之功能亮点源码获取详细视频演示 :文章底部获取博主联系方式!同行可合作健康饮食食材烹饪管理系统(Pytho…

作者头像 李华