小白也能用!GPEN人像修复镜像保姆级入门教程
你是不是也遇到过这些情况:
翻出十年前的老照片,人脸模糊得看不清五官;
朋友发来一张手机抓拍的合影,背景杂乱、皮肤发黄、细节全无;
想用AI修图却卡在环境配置上——装CUDA、配PyTorch、下模型、调路径……折腾半天连第一张图都没跑出来?
别急。今天这篇教程,就是专为“没碰过命令行”“不知道conda是啥”“看到requirements.txt就手抖”的你写的。
不用编译、不改代码、不查报错、不等下载——打开就能修,修完就能用。
我们用的是CSDN星图镜像广场上预装好的GPEN人像修复增强模型镜像,它已经把所有坑都填平了,你只需要做三件事:启动、放图、看效果。
下面全程用大白话带你走一遍,每一步都有截图逻辑(文字描述+命令示例),连终端里光标闪在哪、回车按几次都说清楚。准备好了?咱们开始。
1. 镜像到底是什么?一句话说清
先破除一个误区:“镜像”不是软件安装包,也不是APP,而是一台“已经调好所有参数的虚拟电脑”。
你可以把它理解成——
一位经验丰富的AI工程师,提前给你搭好了一台专用修图工作站:显卡驱动已装好、深度学习框架已配齐、人脸检测模块已加载、GPEN模型权重已放进指定文件夹、连测试图片和运行脚本都放在桌面了。你只要坐上去,点开终端,敲几行字,它就开始干活。
所以,你不需要:
- 自己装CUDA或cuDNN
- 手动pip install几十个依赖(还经常版本冲突)
- 上GitHub找模型、下权重、解压、重命名、放对路径
- 改Python代码里的路径、设备号、图像尺寸
你需要做的,只有三步:
启动这个“预装好的工作站”
把你想修的照片丢进去
敲一条命令,等几秒,拿结果
就这么简单。接下来,我们一步步来。
2. 环境准备:3分钟完成全部初始化
2.1 启动镜像并进入终端
如果你是在CSDN星图镜像广场启动的该镜像,页面会自动弹出一个Web终端(类似网页版的黑窗口)。
首次进入时,你会看到类似这样的提示:
root@inscode:~#这表示你已经以最高权限(root用户)登录进这台“AI修图工作站”了。
不用输密码,不用创建用户,不用任何额外操作——它本来就是为你 ready 的。
小贴士:终端里
#符号前面是当前路径(这里是~,即/root目录),后面是你能输入命令的位置。光标停在#后面,就可以打字了。
2.2 激活预置的Python环境
镜像里装了多个Python环境,但GPEN只认其中一个——叫torch25(意思是“PyTorch 2.5专用环境”)。
我们先把它“打开”,就像开机后点开Photoshop一样:
conda activate torch25敲完回车,你会发现提示符变成这样:
(torch25) root@inscode:~#括号里的torch25就是成功标志
如果提示command not found: conda,说明你没在CSDN星图平台启动,而是本地Docker运行——请确认是否使用官方推荐方式启动(本文默认基于星图平台Web终端场景)。
2.3 进入GPEN工作目录
所有代码、模型、测试图,都放在/root/GPEN这个文件夹里。我们过去:
cd /root/GPEN再敲一次ls(列出当前文件夹内容),你应该能看到这些关键文件:
inference_gpen.py models/ test_imgs/ utils/其中:
inference_gpen.py是主程序(就是那个“一键修复”的按钮)models/文件夹里躺着训练好的AI大脑(不用管它怎么来的)test_imgs/里有一张经典老照片Solvay_conference_1927.jpg(1927年索尔维会议合影,爱因斯坦就在里面)
到这里,环境准备完毕。总共用了不到3分钟,没装任何新东西,也没报任何一个错。
3. 第一次运行:用默认图感受“魔法发生”
我们先不着急修自己的照片,而是用镜像自带的测试图,亲眼看看GPEN是怎么“让模糊变清晰、让衰老变年轻、让噪点变皮肤”的。
3.1 直接运行,默认修这张老照片
在终端里输入:
python inference_gpen.py敲回车,稍等3–8秒(取决于GPU性能),你会看到终端快速滚动几行日志,最后停住,出现类似这样的输出:
[INFO] Input: test_imgs/Solvay_conference_1927.jpg [INFO] Output: output_Solvay_conference_1927.png [INFO] Done. Time: 4.21s成功了!
它自动读取了test_imgs/下的原图,处理完后,把结果存成了output_Solvay_conference_1927.png,就放在当前文件夹(/root/GPEN)里。
3.2 查看修复效果:两步找到图
现在,你有两条路可以看图:
方法一(推荐,最直观):用镜像自带的文件浏览器
- 在CSDN星图界面左侧,点击「文件」图标(看起来像一叠纸)
- 展开路径:
/root/GPEN/output_Solvay_conference_1927.png - 点击它,右侧会直接显示高清修复图 你会明显看到:原本糊成一片的西装领口变得锐利,爱因斯坦的眼镜框线条清晰,后排人物的头发丝一根根浮现。
方法二:用命令行快速确认是否存在
ls -lh output_*.png输出类似:
-rw-r--r-- 1 root root 1.2M Jan 5 10:23 output_Solvay_conference_1927.png说明文件已生成,大小约1.2MB,是张真·高清图。
关键观察点:GPEN不是简单“锐化”,而是重建了真实的人脸结构——毛孔、皱纹、发际线、眼镜反光,都是AI根据人脸先验知识“推理”出来的,不是PS式的拉伸放大。
4. 修你的照片:三行命令搞定全流程
现在轮到你自己的照片了。无论它是微信截图、手机偷拍、扫描件还是证件照,只要有人脸,GPEN都能认出来、修明白。
4.1 准备你的照片:两个要求,超简单
- 格式:JPG 或 PNG(其他格式如WEBP、HEIC需先转一下)
- 内容:画面中至少有一张正脸(侧脸也可,但正面效果最稳)
小技巧:如果照片太大(比如iPhone原图4000×3000),可先用系统自带画图工具缩放到2000×1500以内——GPEN对512×512左右的人脸区域最友好,太大反而慢,太小细节不够。
把照片命名为my_photo.jpg,然后上传到镜像里。
在CSDN星图界面,点击左上角「上传文件」→ 选中你的照片 → 等进度条走完 → 它就会出现在/root/目录下。
4.2 把照片挪进GPEN文件夹(一步到位)
我们让它和代码待在一起,省得每次都要写长路径:
mv /root/my_photo.jpg /root/GPEN/再进GPEN目录确认一下:
cd /root/GPEN && ls my_photo.jpg如果看到my_photo.jpg,就说明放对地方了
4.3 开始修复:一条命令,三种写法任选
写法① 最省心(推荐新手)
python inference_gpen.py --input my_photo.jpg→ 输出文件自动命名为output_my_photo.jpg
写法② 想自定义名字(适合批量处理)
python inference_gpen.py -i my_photo.jpg -o restored_face.png→ 输出就是restored_face.png
写法③ 修完直接看效果(加个预览参数)
python inference_gpen.py --input my_photo.jpg --save_intermediate→ 除了最终图,还会多生成一张中间过程图(带网格定位框),帮你确认AI有没有框准人脸
无论选哪条,回车后等5–12秒(人脸越小越快,越复杂越慢),就会看到Done.提示。
然后用文件浏览器打开/root/GPEN/output_*.jpg,对比原图——你会惊讶于:
▸ 模糊的睫毛变清晰了
▸ 扫描件上的噪点消失了
▸ 光照不均的脸部被智能提亮暗部、压低高光
▸ 即使是戴口罩的照片,露出的眼睛和额头也会被精细修复
这不是滤镜,这是“人脸结构重建”。
5. 进阶技巧:让修复效果更自然、更可控
GPEN默认设置已经很稳,但如果你希望微调效果,这里有3个真正有用、小白也能懂的实用技巧:
5.1 调整“修复力度”:轻修 or 精修?
GPEN内部有个隐含参数叫upscale(放大倍数),它直接影响修复强度:
| 参数值 | 效果特点 | 适用场景 |
|---|---|---|
--upscale 1 | 基础增强,保留原始质感,轻微去模糊 | 证件照、日常合影、不想失真的老照片 |
--upscale 2 | 中度增强,细节更丰富,皮肤更细腻 | 社交头像、产品模特图、需要打印的图片 |
--upscale 4 | 强力重建,可恢复大量丢失结构,但可能略带“AI感” | 极度模糊老照片、监控截图、低分辨率截图 |
用法举例(修图同时指定力度):
python inference_gpen.py -i my_photo.jpg -o soft_enhance.jpg --upscale 1 python inference_gpen.py -i my_photo.jpg -o sharp_detail.jpg --upscale 2注意:
--upscale 4对显存要求较高(建议≥12GB),若报CUDA out of memory,请换回2或1。
5.2 处理多张照片:不用重复敲命令
把所有想修的照片放进同一个文件夹,比如/root/GPEN/batch/,然后用这条命令批量处理:
for img in batch/*.jpg batch/*.png; do [ -f "$img" ] && python inference_gpen.py -i "$img" --upscale 2 done它会自动遍历batch/下所有JPG/PNG,逐张修复,输出名自动加output_前缀。
(复制整段粘贴进终端,回车即可)
5.3 修复失败?先看这三个原因
偶尔会遇到“输出图是纯黑/纯灰/只有半张脸”,别删重装,90%是这三个原因:
| 现象 | 原因 | 解决办法 |
|---|---|---|
| 输出图全黑 | 输入图太大(>4000px)或格式损坏 | 用画图工具另存为JPG,尺寸设为2560×1920以内 |
| 输出图只有眼睛没脸 | 人脸太小(<100×100像素)或严重侧脸 | 用系统自带“照片”App裁剪,让人脸占画面1/3以上 |
终端报No face detected | 图中无人脸,或人脸被遮挡超50%(如戴全脸头盔) | 换一张有人脸的图,或手动用画图工具圈出脸部区域再试 |
这些问题都不用改代码,全是“换张图”“裁一下”“重命名”这种零门槛操作。
6. 常见问题直答:你可能正想问的
Q:必须用Linux命令行吗?有没有图形界面?
A:目前镜像提供的是终端方式,但它比图形界面更稳、更快、更省资源。而且你只需记3条命令(cd、python、ls),比学PS的图层蒙版简单多了。后续若平台上线GUI版本,我们会第一时间更新教程。
Q:修完的照片能商用吗?版权属于谁?
A:你上传的原图版权永远归你;GPEN修复后的图片,其视觉表达由你主导(你选图、你调参、你决定用途),可放心用于自媒体、电商、印刷等场景。模型本身遵循Apache 2.0协议,无商用限制。
Q:能修全身照吗?或者风景照?
A:GPEN是专注人像的模型,对全身照会优先修复脸部区域,身体部分基本不变;对纯风景/建筑/文字类图片,效果有限——它不是万能超分器,而是“人脸专家”。想修风景,建议选Real-ESRGAN类通用超分模型。
Q:为什么不用自己下载模型?镜像里预装的够用吗?
A:够用,且更可靠。镜像内置的是ModelScope社区认证的iic/cv_gpen_image-portrait-enhancement官方权重,经CVPR论文作者团队验证,支持512×512高精度修复。自己下载容易遇到链接失效、文件损坏、版本不匹配等问题。
7. 总结:你已经掌握了人像修复的核心能力
回顾一下,你刚刚完成了这些事:
在3分钟内,跳过所有环境配置,直接进入可运行状态
用一行命令,修复了一张百年老照片,亲眼见证AI重建人脸结构的能力
学会上传自己的照片,并用不同参数获得轻修/精修/强力修复三种效果
掌握了批量处理、常见报错排查、输出命名控制等真实工作流技巧
你不需要成为算法工程师,也不用读懂那篇CVPR论文——
你只需要知道:这张图我想修,我有这张图,我敲一行字,它就给我一张更好的图。
这就是AI工具真正的意义:把前沿技术,变成人人可用的“数字橡皮擦”。
下一步,你可以试试:
- 用
--upscale 1修身份证照,确保公安系统识别通过 - 把家庭群里的模糊合照批量修复,发到朋友圈收获惊叹
- 为小红书/抖音做封面图,用GPEN+Canva组合,10分钟出片
技术从不遥远,它就在你敲下回车的那一刻,开始为你服务。
获取更多AI镜像
想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。