news 2026/5/15 21:38:46

【vLLM 学习】Simple Profiling

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【vLLM 学习】Simple Profiling

vLLM 是一款专为大语言模型推理加速而设计的框架,实现了 KV 缓存内存几乎零浪费,解决了内存管理瓶颈问题。

更多 vLLM 中文文档及教程可访问 →https://hyper.ai/notebooks/37048?utm_source=Distribute&utm_medium=Distribute-vLLM&utm_campaign=Distribute-vLLM-260126

*在线运行 vLLM 入门教程:零基础分步指南

源码 examples/offline_inference/simple_profiling.py

# SPDX-License-Identifier: Apache-2.0 import os import time from vllm import LLM, SamplingParams # 启用 torch 分析器,也可以在命令行设置 os.environ["VLLM_TORCH_PROFILER_DIR"] = "./vllm_profile" # 样本提示。 prompts = [ "Hello, my name is", "The president of the United States is", "The capital of France is", "The future of AI is", ] # 创建一个采样参数对象。 sampling_params = SamplingParams(temperature=0.8, top_p=0.95) if __name__ == "__main__": # 创建一个 LLM。 llm = LLM(model="facebook/opt-125m", tensor_parallel_size=1) llm.start_profile() # 从提示中生成文本。输出是 RequestOutput 的包含提示,生成文本和其他信息的对象列表。 outputs = llm.generate(prompts, sampling_params) llm.stop_profile() # 打印输出。 for output in outputs: prompt = output.prompt generated_text = output.outputs[0].text print(f"Prompt: {prompt!r}, Generated text: {generated_text!r}") # 添加一个缓冲区,在后台过程中等待 profiling(如果 MP 为 ON) 完成分析输出。 time.sleep(10)
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/12 10:10:03

深入浅出Java Condition 的await和signal机制(一)

每个对象都可以调用 Object 的 wait/notify 方法来实现等待/通知机制。而 Condition 接口也提供了类似的方法。Condition 接口一共提供了以下 7 个方法:await():线程等待直到被通知或者中断。类似于 Object.wait()。awaitUninterruptibly():线…

作者头像 李华
网站建设 2026/5/12 10:11:27

开发外卖取餐码语音播报工具,输入取餐码自动语音提醒,支持自定义播报语速,解决外卖多找码难,手忙脚乱问题,适配手机端,无需复杂操作,精准播报不报错。

1. 实际应用场景与痛点 场景 现代人点外卖频率很高,尤其是上班族、学生、家庭用户。外卖到达后,骑手会在门口打电话或发短信告知取餐码,但经常出现: - 手里提着东西,不方便看手机 - 环境嘈杂听不清骑手说的取餐码 - …

作者头像 李华
网站建设 2026/5/9 11:34:53

携手NVIDIA,英飞凌为人形机器人提供精准运动与高效解决方案

电机驱动芯片 全球功率系统和物联网领域的半导体领导者英飞凌科技股份公司(FSE代码:IFX/OTCQX代码:IFNNY)宣布携手NVIDIATechnology(简称:NVIDIA英伟达,下同)加速人形机器人领域的研…

作者头像 李华
网站建设 2026/5/10 14:46:42

亲测好用 10个一键生成论文工具:自考毕业论文+开题报告高效写作测评

在当前学术写作日益依赖智能化工具的背景下,自考学生在撰写毕业论文和开题报告时也面临着选题困难、资料查找繁琐、格式规范不熟悉等普遍问题。为了帮助广大自考生更高效地完成论文写作任务,我们基于2026年的实测数据与真实用户反馈,对市面上…

作者头像 李华
网站建设 2026/5/14 8:30:37

SEW变频器MC07A300-503-4-10 08273049

SEW变频器MC07A300-503-4-10 08273049 详细介绍 一、产品概述 SEW变频器MC07A300-503-4-10(序列号:08273049)是德国SEW-EURODRIVE公司推出的工业级模块化变频器,专为三相异步电机设计,属于MOVIMOT系列中的紧凑型产品…

作者头像 李华