news 2026/5/8 4:46:04

MiniCPM4-0.5B-QAT-Int4-GPTQ-format 小显存llm

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
MiniCPM4-0.5B-QAT-Int4-GPTQ-format 小显存llm

MiniCPM4-0.5B-QAT-Int4-GPTQ-format · 模型库

from modelscope import AutoTokenizer from vllm import LLM, SamplingParams model_name = "OpenBMB/MiniCPM4-0.5B-QAT-Int4-GPTQ-format" prompt = [{"role": "user", "content": "推荐5个北京的景点。"}] tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True) input_text = tokenizer.apply_chat_template(prompt, tokenize=False, add_generation_prompt=True) llm = LLM( model=model_name, quantization="gptq_marlin", trust_remote_code=True, max_num_batched_tokens=32768, dtype="bfloat16", gpu_memory_utilization=0.8, ) sampling_params = SamplingParams(top_p=0.7, temperature=0.7, max_tokens=1024, repetition_penalty=1.02) outputs = llm.generate(prompts=input_text, sampling_params=sampling_params) print(outputs[0].outputs[0].text)
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/8 4:44:59

【计算机毕业设计案例】基于springboot的房产交易系统基于springboot的房地产销售管理系统(程序+文档+讲解+定制)

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

作者头像 李华
网站建设 2026/5/8 4:44:59

基于51单片机多功能婴儿床控制系统 尿液检测 防掉床 蓝牙

目录51单片机多功能婴儿床控制系统概述核心功能模块硬件设计要点软件逻辑流程关键参数与优化扩展功能建议源码文档获取/同行可拿货,招校园代理 :文章底部获取博主联系方式!51单片机多功能婴儿床控制系统概述 该系统基于51单片机设计,整合了尿…

作者头像 李华
网站建设 2026/5/8 4:45:07

【LeetCode刷题】随机链表的复制

给你一个长度为 n 的链表,每个节点包含一个额外增加的随机指针 random ,该指针可以指向链表中的任何节点或空节点。 构造这个链表的 深拷贝。 深拷贝应该正好由 n 个 全新 节点组成,其中每个新节点的值都设为其对应的原节点的值。新节点的 n…

作者头像 李华
网站建设 2026/5/8 4:45:07

【LeetCode刷题】排序链表

给你链表的头结点 head ,请将其按 升序 排列并返回 排序后的链表 。示例 1:输入:head [4,2,1,3] 输出:[1,2,3,4]示例 2:输入:head [-1,5,3,4,0] 输出:[-1,0,3,4,5]示例 3:输入&…

作者头像 李华
网站建设 2026/5/4 21:24:39

鸿蒙中级课程笔记3—ArkUI进阶1—属性动画与转场动画

动画概述 UI中包含开发者与设备进行交互时所看到的各种组件。 属性作为接口,用于控制组件的行为。属性值的变化,通常会引起UI的变化。 动画可在UI发生改变时,添加流畅的过渡效果。如果不加入动画,属性将在一瞬间完成变化。造成…

作者头像 李华