news 2026/3/23 17:48:05

Meta-Llama-3.1-8B-bnb-4bit 下载加载

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Meta-Llama-3.1-8B-bnb-4bit 下载加载

Meta-Llama-3.1-8B-bnb-4bit 加载:

from huggingface_hub import InferenceClient from torch import nn from transformers import ( AutoModel, AutoProcessor, AutoTokenizer, AutoModelForCausalLM, PreTrainedTokenizer, PreTrainedTokenizerFast, BitsAndBytesConfig, ) from pathlib import Path import torch from PIL import Image import os # =============================== # CLIP (SigLIP) # # =============================== # model_id = "google/siglip-so400m-patch14-384" # CLIP_PATH = download_hg_model(model_id, "clip") # clip_processor = AutoProcessor.from_pretrained( # CLIP_PATH, # trust_remote_code=True # ) # clip_model = AutoModel.from_pretrained( # CLIP_PATH, # trust_remote_code=True # ) # clip_model = clip_model.vision_model # clip_model.eval() # clip_model.requires_grad_(False) # clip_model.to("cuda") # =============================== # LLM (LLaMA 3.1 4bit) # =============================== MODEL_PATH = "/data/lbg/models/textoon/ComfyUI/models/LLM/Meta-Llama-3.1-8B-bnb-4bit" tokenizer = AutoTokenizer.from_pretrained( MODEL_PATH, trust_remote_code=True, use_fast=True ) assert isinstance( tokenizer, (PreTrainedTokenizer, PreTrainedTokenizerFast) ), f"Tokenizer is of type {type(tokenizer)}" # ⭐ 2️⃣ bitsandbytes 4bit 配置(关键) bnb_config = BitsAndBytesConfig( load_in_4bit=True, bnb_4bit_quant_type="nf4", bnb_4bit_compute_dtype=torch.float16, bnb_4bit_use_double_quant=True, ) # ⭐ 3️⃣ 正确加载 4bit 模型 text_model = AutoModelForCausalLM.from_pretrained( MODEL_PATH, quantization_config=bnb_config, device_map="auto", trust_remote_code=True, ) text_model.eval()
pip install bitsandbytes
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/13 21:49:44

程序员的好日子真的到头了吗?2025年后端薪资大跌,相反AI相关岗位的薪资却水涨船高!

2025年的程序员招聘市场,正在上演一场比剧本更魔幻的现实。成都某公司的招聘启事上写着 “会调教AI写Java代码者优先” ,深圳科技园出现了按小时结算的“程序员灵活用工中心”。 脉脉发布的《2025年度人才迁徙报告》显示,高薪岗位TOP20的平均…

作者头像 李华
网站建设 2026/3/13 2:27:49

基于Springboot+Vue超市仓库管理系统(完整源码+万字论文+答辩PPT)

作者贡献介绍 💗CSDN从事毕设辅导第一人,本着诚信、靠谱、质量在业界获得优秀口碑,在此非常希望和行业内的前辈交流学习,欢迎成考学历咨询老师、大学老师前来合作交流💗 2013年,正式踏入技术写作领域&…

作者头像 李华
网站建设 2026/3/13 15:29:36

教育软件用户体验测试:策略、挑战与最佳实践‌

教育软件的独特性与测试需求 教育软件作为数字化学习生态的核心,其用户体验(UX)直接影响学习成效和用户黏性。与传统软件不同,教育软件需兼顾教学性、互动性和易用性,例如在K-12或职业培训场景中,界面设计…

作者头像 李华
网站建设 2026/3/23 16:01:58

【ACWing】151. 表达式计算4

题目地址: https://www.acwing.com/problem/content/description/153/ 给出一个表达式,其中运算符仅包含,-,*,/,^(加 减 乘 整除 乘方)要求求出表达式的最终值。 数据可能会出现括号情况,还有可能出现多余括号情况。 数据保证不…

作者头像 李华
网站建设 2026/3/16 3:33:25

自动化测试的三种核心模式:策略选择与实践洞察

在敏捷开发与DevOps实践成为主流的当下,自动化测试已成为保障软件质量、加速产品迭代的关键环节。据行业报告显示,实施有效自动化测试的团队产品发布周期平均缩短40%。本文将深入解析基于界面的录制回放、数据驱动测试与关键字驱动测试这三种主流自动化测…

作者头像 李华