news 2026/4/16 8:28:31

【Z-Image-Turbo 量化模型】svdq-int4 / fp4 多版本对比与下载说明svdq-int4_r256-z-image-turbo.safetensors

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【Z-Image-Turbo 量化模型】svdq-int4 / fp4 多版本对比与下载说明svdq-int4_r256-z-image-turbo.safetensors

【Z-Image-Turbo Nunchaku 量化模型下载】svdq-int4 / fp4 多版本对比与下载说明 svdq-int4_r256-z-image-turbo.safetensors

关键词:Z-Image-Turbo、SVDQuant、INT4、FP4、Diffusion 模型量化、ICLR2025
最近在折腾文生图模型的推理性能优化时,接触到了Nunchaku 团队基于 Z-Image-Turbo 的 SVDQuant 量化版本,实际体验下来,对显存占用和推理速度的改善非常明显,这里做一次完整梳理和记录。

模型下载地址(网盘链接)

本文主要介绍以下五个常用模型文件 可通过网盘获取:

  • svdq-int4_r256-z-image-turbo.safetensors
  • svdq-int4_r128-z-image-turbo.safetensors
  • svdq-fp4_r128-z-image-turbo.safetensors
  • svdq-int4_r32-z-image-turbo.safetensors
  • svdq-fp4_r32-z-image-turbo.safetensors

👉网盘下载地址:
https://pan.quark.cn/s/472aeef09aa4?pwd=fCD2


一、模型背景说明

Z-Image-Turbo是 Tongyi-MAI 推出的高性能文生图模型,在生成质量和速度之间做了比较好的平衡。

Nunchaku团队基于 ICLR 2025 的论文成果SVDQuant,对该模型进行了4bit 级别量化,在尽量不损失画质的前提下,大幅降低了显存和算力需求。


二、模型核心信息一览

base_model:Tongyi-MAI/Z-Image-Turbobase_model_relation:quantizeddatasets:-mit-han-lab/svdquant-datasetslibrary_name:diffuserspipeline_tag:text-to-imagelicense:apache-2.0language:-entags:-image-editing-SVDQuant-Z-Image-Turbo-Diffusion-Quantization-ICLR2025

三、项目与模型展示


四、模型说明(Model Card 摘要)

1️⃣ 基本介绍

  • 模型名称:nunchaku-z-image-turbo
  • 模型类型:Text-to-Image / Image Editing
  • 开发团队:Nunchaku Team
  • 原始模型:Tongyi-MAI / Z-Image-Turbo
  • 许可证:Apache-2.0

该仓库包含的是Nunchaku 优化后的 Z-Image-Turbo 量化模型版本,主打高效推理 + 低显存占用


2️⃣ 量化方式说明(重点)

显卡类型数据类型
50 系列以下显卡INT4
50 系列(Blackwell)NVFP4

Rank(低秩分解维度)说明:

  • r32:速度最快,画质一般
  • r128:速度与质量平衡(推荐)
  • r256:质量最高,速度最慢

五、模型文件对照表

标准推理模型(通用)

数据类型Rank模型文件名
INT4r32svdq-int4_r32-z-image-turbo.safetensors
INT4r128svdq-int4_r128-z-image-turbo.safetensors
INT4r256svdq-int4_r256-z-image-turbo.safetensors
NVFP4r32svdq-fp4_r32-z-image-turbo.safetensors
NVFP4r128svdq-fp4_r128-z-image-turbo.safetensors

📌个人建议

  • 显存 8G~12GINT4 r128
  • 追求画质INT4 r256
  • 50 系显卡:优先FP4 r128

六、使用方式说明

1️⃣ Diffusers 使用

官方示例代码在这里:

  • 示例脚本:
    https://github.com/nunchaku-tech/nunchaku/blob/main/examples/v1/z-image-turbo.py

  • 使用文档:
    https://nunchaku.tech/docs/nunchaku/usage/zimage.html


2️⃣ ComfyUI 工作流

  • 官方工作流 JSON:
    https://nunchaku.tech/docs/ComfyUI-nunchaku/workflows/zimage.html#nunchaku-z-image-turbo-json

对于习惯ComfyUI 可视化工作流的用户来说,几乎是即插即用。


七、性能表现参考

从官方测试图可以看到:

  • 4bit 量化后显存占用大幅下降
  • 推理速度在中低端显卡上提升明显
  • 对生成质量影响相对可控(尤其 r128 / r256)


九、参考与来源

  • 推理引擎:
    https://github.com/nunchaku-tech/nunchaku
  • 量化工具:
    https://github.com/nunchaku-tech/deepcompressor
  • 论文:
    https://arxiv.org/abs/2411.05007
  • 在线 Demo:
    https://demo.nunchaku.tech

十、写在最后

如果你正在做本地文生图部署、ComfyUI 工作流优化、低显存显卡推理,这套Z-Image-Turbo 的 SVDQuant 版本确实值得尝试。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/15 14:14:25

YOLOFuse贡献者招募:欢迎提交PR修复文档或代码bug

YOLOFuse:让多模态目标检测更简单,欢迎贡献你的第一行代码 在低光照的深夜街道上,普通摄像头几乎无法看清行人轮廓,而红外相机却能清晰捕捉到人体散发的热信号。这正是智能安防、自动驾驶等系统面临的真实挑战——单靠可见光图像…

作者头像 李华
网站建设 2026/4/15 15:33:38

YOLOFuse客户成功案例分享:某安防公司落地实施纪实

YOLOFuse客户成功案例分享:某安防公司落地实施纪实 在智能安防系统日益普及的今天,一个看似不起眼的问题却长期困扰着工程师们:为什么摄像头白天看得清清楚楚,一到晚上就“失明”? 答案显而易见——可见光依赖环境光照…

作者头像 李华
网站建设 2026/4/15 23:04:08

YOLOFuse文档完善计划:后续将增加API接口说明与视频教程

YOLOFuse:轻量级RGB-红外融合检测系统的架构设计与应用实践 在智能安防、自动驾驶和夜间监控等现实场景中,单一可见光图像的目标检测正面临越来越严峻的挑战。低光照环境下图像信噪比急剧下降,烟雾或雾霾导致视觉遮挡,这些因素都会…

作者头像 李华
网站建设 2026/4/12 12:51:33

(OpenMP 5.3负载均衡性能优化秘籍):专家不愿公开的技术细节曝光

第一章:OpenMP 5.3负载均衡的核心机制OpenMP 5.3 在并行计算领域进一步优化了任务调度与负载均衡策略,提升了多线程环境下的执行效率。其核心机制依赖于动态任务分配、自适应调度策略以及用户可定制的运行时控制,确保在线程间实现更均匀的工作…

作者头像 李华
网站建设 2026/4/15 1:33:28

基于spring的健身管理系统[VUE]-计算机毕业设计源码+LW文档

摘要:随着人们健康意识的提升,健身行业蓬勃发展,对健身场所的高效管理需求也日益增长。本文设计并实现了一个基于Spring框架的健身管理系统,旨在为健身房提供全面、便捷的管理工具。系统采用Spring、Spring MVC和MyBatis技术框架&…

作者头像 李华
网站建设 2026/4/13 6:59:47

为什么你的泛型代码不安全?C17类型检查机制全剖析

第一章:C17泛型类型安全的核心挑战C17标准虽未直接引入泛型编程语法,但在现代C语言实践中,开发者常借助宏与类型推导技巧模拟泛型行为。这种模式在提升代码复用性的同时,也带来了显著的类型安全挑战。由于缺乏编译时类型检查机制&…

作者头像 李华