news 2025/12/24 7:23:32

rvm抠图笔记

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
rvm抠图笔记
import torch import cv2 import numpy as np from PIL import Image from torchvision import transforms from model import MattingNetwork # RVM 的模型定义文件 # 加载模型 model = MattingNetwork("resnet50") model.load_state_dict(torch.load(r"D:\project\seg\jacke121-rvm_128_json\model_a\rvm_resnet50.pth", map_location="cpu")) model = model.eval() # 输入图像 # img = cv2.imread("input.jpg")[:, :, ::-1] # BGR -> RGB # img = cv2.imread(r"D:\project_2025\live2d\LayerDiffuse_DiffusersCLI-main\imgs\inputs\mm01.jpg") # BGR -> RGB img = cv2.imread(r"D:\soft\801.jpeg") # BGR -> RGB img = cv2.imread(r"D:\soft\805.png") # BGR -> RGB h, w, _ = img.shape # 转 tensor img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB) img = img.astype(np.float32) / 255.0 # 归一化到 0-1 # 转 tensor: [H,W,3] -> [1,3,H,W] src = torch.from_numpy(img).permute(2, 0, 1).unsqueeze(0) src = src.cpu() # RVM 需要 recurrent states (init None) rec = [None] * 4 # 推理,RVM 输入为:src, downsample_ratio, *rec with torch.no_grad(): fgr, pha, *rec = model(src, downsample_ratio=0.25, *rec) # fgr: foreground,pha: alpha matte fgr = fgr[0].permute(1, 2, 0).cpu().numpy() pha = pha[0].permute(1, 2, 0).cpu().numpy() # 合成为 rgba rgba = np.concatenate([fgr, pha], axis=2) # [H,W,4] rgba = (rgba * 255).astype(np.uint8) Image.fromarray(rgba).save("output_rvm.png") print("Done: output_rvm.png")
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2025/12/12 15:54:09

Java高频面试基础问题整理(答案可自行借助各种AI)

希望大家也可以多在评论区补充你们面试遇到的问题谢谢,每天进步一点点(一)Java基础高频知识考点1.基本类型和包装类区别2.实例方法和静态方法有什么不一样?3.Java指向的是引用还是地址?怎么理解?&#xff0…

作者头像 李华
网站建设 2025/12/12 15:54:08

Beyond Compare 5完整授权管理指南

Beyond Compare 5完整授权管理指南 【免费下载链接】BCompare_Keygen Keygen for BCompare 5 项目地址: https://gitcode.com/gh_mirrors/bc/BCompare_Keygen Beyond Compare作为业界领先的文件对比工具,其强大的功能深受开发者和技术人员的喜爱。本文将详细…

作者头像 李华
网站建设 2025/12/12 15:54:02

活动回顾丨 北大/清华/Zilliz/MoonBit共话开源,覆盖视频生成/视觉理解/向量数据库/AI原生编程语言

当下,AI 产业正迎来一个前所未有的发展周期。大模型的规模化应用、AI 原生软件体系的重构、多模态基础模型的加速演进,让学界与产业界的边界变得愈发模糊。无论是视频生成对音画同步的精细化要求、终端侧视觉模型的高效推理优化,还是新一代 A…

作者头像 李华
网站建设 2025/12/21 19:10:24

【目标融合】基于扩展卡尔曼滤波(EKF)实现融合雷达和激光雷达数据,最终估计目标的运动轨迹附matlab代码

✅作者简介:热爱科研的Matlab仿真开发者,擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页:Matlab科研工作室🍊个人信条:格物致知,完整Matlab代码获取及仿真…

作者头像 李华
网站建设 2025/12/21 22:15:44

【TSP问题】基于鲸鱼迁徙算法WMA和金枪鱼算法TSO求解旅行商TSP问题(可根据城市的经纬度设置自己想要到达的地区)附Matlab代码

✅作者简介:热爱科研的Matlab仿真开发者,擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页:Matlab科研工作室🍊个人信条:格物致知,完整Matlab代码获取及仿真…

作者头像 李华