小白必看!Nunchaku FLUX.1保姆级教程:从安装到出图全流程
导语:不用配环境、不装依赖、不调参数——选好镜像,点几下鼠标,30秒内生成一张高清插画。本文手把手带你用 Nunchaku FLUX.1 CustomV3 镜像,在 ComfyUI 中完成从零到图的完整流程。RTX 4090 单卡即可运行,连显卡型号都不用纠结,小白照着做就能出图。
1. 为什么选这个镜像?三句话说清它强在哪
Nunchaku FLUX.1 CustomV3 不是普通“套壳”工作流,而是经过实测打磨的开箱即用方案。它把三个关键能力拧成一股绳:
- 主模型稳:基于 FLUX.1-dev 开源底座,生成结构扎实、构图合理,人物比例和场景逻辑不容易崩;
- 速度够快:融合了 FLUX.1-Turbo-Alpha 加速分支,单张 1024×1024 图像平均耗时约 8–12 秒(RTX 4090);
- 风格更出片:叠加 Ghibsky Illustration LoRA,让画面自带吉卜力式柔和光影与细腻笔触,不是“AI感”浓重的塑料质感,而是有温度、能印刷的插画级输出。
你不需要知道什么是 LoRA、什么是 Turbo 分支、什么是 CLIP 编码器——就像你不需要懂发动机原理也能开车。这篇文章只告诉你:点哪里、输什么、等多久、怎么存。
2. 三步启动:5分钟完成全部准备
整个过程不涉及命令行、不改配置文件、不下载模型包。所有操作都在网页界面中完成,适合第一次接触 ComfyUI 的用户。
2.1 选择镜像并启动服务
- 登录你的 AI 镜像平台(如 CSDN 星图镜像广场)
- 搜索关键词
Nunchaku FLUX.1 CustomV3,找到对应镜像卡片 - 点击「启动」或「一键部署」,系统自动分配资源(推荐选择 RTX 4090 实例,其他如 4080/4070 也可运行,仅生成稍慢)
- 等待状态变为「运行中」,点击「打开 Web UI」按钮,进入 ComfyUI 主界面
注意:首次加载可能需要 30–60 秒,请耐心等待页面完全渲染。若卡在白屏或报错,刷新页面通常可解决。
2.2 进入正确工作流
ComfyUI 默认打开的是空白画布,你需要手动加载预置流程:
- 在顶部菜单栏,点击Workflow(工作流)选项卡
- 在下拉列表中,选择名为
nunchaku-flux.1-dev-myself的工作流 - 页面将自动加载一整套节点图:从文本输入、编码、扩散采样,到图像保存,全部已连接完毕
此时你看到的不是代码,而是一张“可视化操作图”——每个方块是一个功能模块,箭头代表数据流向。你不需要理解每个模块的作用,只需关注两个关键节点:CLIP Text Encode(文字输入处)和Save Image(保存出口)。
2.3 检查硬件与分辨率设置(可跳过,但建议扫一眼)
虽然默认设置已适配大多数需求,但新手容易忽略两个影响出图的关键项:
- 采样步数(Steps):默认为 20,对 FLUX.1 类模型足够。低于 15 容易细节不足;高于 30 提升有限且耗时翻倍,不建议新手调整。
- 图像尺寸(Width / Height):默认为
1024×1024,这是该工作流的最佳平衡点。若想生成横版海报,可改为1536×768;竖版手机壁纸可设为768×1536。注意:宽高比尽量保持 1:1、2:1 或 1:2,避免严重形变。
其余参数(如 CFG Scale、Sampler Type)均按 Ghibsky 插画风格做了预优化,首次使用请勿修改,先跑通流程再尝试微调。
3. 写提示词:不是写作文,是“给AI下指令”
很多新手卡在第一步:明明写了“一只猫”,结果生成了一团毛线球。问题不在模型,而在提示词的表达方式。FLUX.1 对语言结构敏感,需用“主谓宾+修饰词”的清晰句式,而非散文式描述。
3.1 好提示词的四个要素(附对比示例)
| 要素 | 说明 | 差示例 | 好示例 |
|---|---|---|---|
| 主体明确 | 先说“谁/什么”,不加模糊代词 | “它站在那里” | “一只橘猫坐在窗台边” |
| 动作具体 | 动词要可视觉化 | “看起来很开心” | “尾巴高高翘起,眼睛眯成月牙” |
| 环境简洁 | 用1–2个关键词锚定场景 | “在一个很有氛围感的地方” | “阳光透过百叶窗洒在木地板上” |
| 风格锁定 | 结尾加风格词,激活 LoRA | “画风可爱” | “吉卜力工作室风格,柔和水彩质感” |
推荐组合公式:
[主体] + [动作/姿态] + [环境细节] + [风格词]
示例:
一位穿蓝裙子的小女孩踮脚摘苹果,果园里苹果树挂满红果,阳光斑驳,吉卜力工作室风格,柔焦背景,8K细节
这个提示词在 Nunchaku FLUX.1 CustomV3 上实测一次出图成功率超 90%,无需反复重试。
3.2 修改提示词的实操步骤
- 在工作流中找到标有
CLIP Text Encode的蓝色节点(通常位于左上方) - 双击该节点,弹出文本框
- 清空原有文字,粘贴你写好的提示词(支持中文,无需翻译)
- 关闭弹窗,文字已自动生效
小技巧:提示词中可加入负面词控制效果,例如在末尾加
--no deformed, blurry, text, signature,能有效规避畸变、模糊和乱码问题。但首次使用建议先不加,确保基础流程跑通。
4. 生成与保存:两键搞定,所见即所得
一切就绪后,真正的“出图时刻”只需两步:
4.1 点击运行,安静等待
- 点击右上角绿色Run按钮(图标为三角形播放键)
- 页面右下角会出现进度条和日志窗口,显示当前执行阶段:
Loading model → Encoding text → Sampling step 1/20 → ... → Decoding image - RTX 4090 实例下,全程约 8–12 秒;4070 约 15–20 秒。期间可喝口水,不必盯着屏幕。
成功标志:进度条走完后,中间画布区域会自动显示一张预览图,清晰、无噪点、无明显结构错误。
4.2 保存高清原图(关键!别只截图)
很多人误以为预览图就是最终结果,直接截图保存,导致画质损失严重。正确做法是:
- 找到标有
Save Image的黄色节点(通常在右下方) - 鼠标右键单击该节点
- 在弹出菜单中选择Save Image(不是 Preview Image)
- 浏览器将自动下载 PNG 格式文件,分辨率为工作流设定值(默认 1024×1024),无压缩、无损色
注意:若右键无反应,请确认浏览器未开启弹窗拦截;或尝试 Chrome/Firefox 最新版。Edge 有时存在兼容性问题,建议切换。
5. 效果优化:三次微调,让图更接近你想要的样子
第一次出图满意?恭喜你已掌握核心流程。若想进一步提升质量,以下三个低成本调整项,无需重学技术,全是“点一下就见效”的实用技巧。
5.1 调整 CFG Scale:控制“听话程度”
CFG(Classifier-Free Guidance)Scale 是影响 AI 发挥自由度的关键参数:
- 数值低(1–5):AI 更“放飞”,创意性强但容易偏离描述
- 数值中(7–12):平衡点,推荐新手固定用
8,既忠于提示词,又保留自然感 - 数值高(15+):AI 过度拘泥文字,画面僵硬、色彩发灰,慎用
操作路径:
找到KSampler节点 → 修改CFG输入框数值 → 再次点击 Run
实测对比:同一提示词下,CFG=8 输出光影柔和、角色生动;CFG=15 则人物面部紧绷、背景纹理生硬。
5.2 换采样器:提速不降质的隐藏开关
默认采样器为euler,稳定但略慢。dpmpp_2m_sde_gpu是 FLUX.1-Turbo 分支专优采样器,提速约 25%,且对复杂提示词鲁棒性更强。
操作路径:KSampler节点 → 下拉Sampler Name→ 选择dpmpp_2m_sde_gpu→ Run
注意:切换后首次运行可能稍慢(需加载新 kernel),后续即刻生效。
5.3 启用高清修复(Upscale):让细节跃然纸上
默认输出已是 1024×1024,但若你追求印刷级或大屏展示效果,可启用内置放大流程:
- 在工作流中找到标有
Upscale Model的节点(灰色,带放大镜图标) - 双击 → 选择
4x_NMKD-Superscale-SP_178000_G.pth(这是专为插画优化的放大模型) - 连接其输出至
Save Image节点(拖动连线即可) - Run 后将输出 4096×4096 图像,毛发、布纹、树叶脉络等细节显著增强
提示:此步会增加约 3–5 秒耗时,建议仅对“终稿”启用,日常测试跳过即可。
6. 常见问题速查:90% 的卡点,这里都有解
新手实操中最常遇到的问题,我们按发生顺序归类,并给出“一句话解决方案”。
6.1 启动阶段问题
Q:镜像启动后打不开 ComfyUI,显示“Connection refused”
A:等待 2–3 分钟再刷新,后台服务初始化需要时间;若超 5 分钟仍失败,重启实例。Q:Workflow 下拉菜单为空,找不到
nunchaku-flux.1-dev-myself
A:确认是否误入「Custom Nodes」或「Manager」标签页;务必在顶部Workflow选项卡中查找。
6.2 提示词与生成问题
Q:图出来了,但和提示词完全不符(比如写猫却出狗)
A:检查是否误改了CLIP Text Encode节点以外的其他文本节点(如 negative prompt);清空所有非必要输入,只留主提示词。Q:画面有奇怪的黑块、扭曲线条或重复肢体
A:立即添加负面词--no deformed, extra limbs, malformed hands, bad anatomy,并降低 CFG 至 7。
6.3 保存与画质问题
Q:保存的图片是纯黑/纯灰/全白
A:检查KSampler节点的Seed是否为-1(随机种子);若为固定数字(如 123),请改为-1或点击旁边的🎲图标重新随机。Q:下载的 PNG 打开后模糊、有马赛克
A:确认你点击的是Save Image(右键菜单),而非直接右键图片→“另存为”。后者保存的是低分辨率预览图。
7. 总结:你已经掌握了专业级文生图的第一把钥匙
回顾整个流程,你其实只做了五件事:
① 点一下「启动镜像」
② 选一个预设工作流
③ 输入一句清楚的中文描述
④ 点一下「Run」
⑤ 右键「Save Image」
没有环境配置,没有模型下载,没有参数调试——这就是 Nunchaku FLUX.1 CustomV3 的设计哲学:把技术藏在背后,把创作交还给你。
你现在可以:
- 用 30 秒生成一张社交平台配图
- 为孩子的故事定制专属插画
- 快速产出产品概念草图供团队讨论
- 把脑海中的画面,变成可分享、可打印、可延展的真实资产
下一步,不妨试试这些小挑战:
🔹 用同一提示词,分别设 CFG=6、8、10,观察画面变化
🔹 换一个风格词,比如“赛博朋克霓虹”“水墨晕染”“像素艺术”,看 LoRA 如何响应
🔹 把生成图拖进Load Image节点,接上Inpaint模块,实现局部重绘
创作没有标准答案,而你,已经站在了起点。
获取更多AI镜像
想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。