news 2026/4/19 8:11:40

探索Transform的中不同参数的用法

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
探索Transform的中不同参数的用法

1问题

1,ToTensor:将PIL Image或numpy.ndarray转换为torch.FloatTensor,并将其归一化到[0.0, 1.0]范围内。

2,Normalize:将PIL Image或numpy.ndarray转换为torch.FloatTensor,并将其归一化到[-1.0, 1.0]范围内。

3,Resize:调整图像大小。

4,CenterCrop:将给定的PIL Image进行中心切割,得到给定的size。

5,Compose:将多个变换组合在一起。

6,RandomCrop:从图像中随机裁剪出一定大小的区域。

2 方法

数据转换:transforms.ToTensor()

ToTensor是transforms模块中的一个函数,用于将PIL Image或numpy.ndarray类型的数据转换为torch.FloatTensor类型。在Pytorch中,图像数据通常以PIL Image的形式存在,而模型训练时需要的数据格式为torch.FloatTensor

from torchvision import transforms # 创建一个ToTensor实例


to_tensor = transforms.ToTensor() # 对图像进行ToTensor转换
image = Image.open('example.jpg')
image_tensor = to_tensor(image)

数据归一化:transforms.Normalize()

Normalize是transforms模块中的一个函数,用于将PIL Image或numpy.ndarray类型的数据进行归一化处理。归一化是将数据缩放到一个特定的范围,通常是[0, 1]或[-1, 1]。在图像处理中,归一化可以使得不同尺度的图像具有相同的尺度,从而方便模型的训练和预测。

from torchvision import transforms # 创建一个Normalize实例,指定均值和标准差


normalize = transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]) # 对图像进行Normalize转换
image = Image.open('example.jpg')
normalized_image = normalize(image)

调整图像大小transforms.Resize()

Resize是transforms模块中的一个函数,用于调整图像的大小。在图像处理中,我们需要将不同大小的图像输入到模型中进行训练和预测

from torchvision import transforms # 创建一个Resize实例,指定目标尺寸


resize = transforms.Resize((224, 224)) # 对图像进行Resize转换
image = Image.open('example.jpg')
resized_image = resize(image)

从图像中心裁剪出指定大小的区域transforms.CenterCrop()

CenterCrop是transforms模块中的一个函数,用于从图像中心裁剪出指定大小的区域。在图像处理中,我们需要将不同大小的图像输入到模型中进行训练和预测。因此,我们需要对图像进行大小调整,使其具有相同的尺寸。

from torchvision import transforms # 创建一个CenterCrop实例,指定目标尺寸


center_crop = transforms.CenterCrop((224, 224)) # 对图像进行CenterCrop转换
image=Image.open('example.jpg') center_cropped_image = center_crop(image)

对图像进行多种不同的操作:transforms.Compose()

Compose是transforms模块中的一个函数,用于将多个变换组合在一起。在图像处理中,我们可能需要对图像进行多种不同的操作,例如缩放、裁剪、旋转等

from torchvision import transforms # 创建一个Compose实例,指定多个变换操作


compose=transforms.Compose([ transforms.Resize((224, 224)),transforms.CenterCrop(224), transforms.ToTensor(), transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]) ]) # 对图像进行Compose转换 image = Image.open('example.jpg')
composed_image = compose(image)

从图像中随机裁剪出指定大小的区域transforms.RandomCrop()

RandomCrop是transforms模块中的一个函数,用于从图像中随机裁剪出指定大小的区域

from torchvision import transforms # 创建一个RandomCrop实例,指定目标尺寸


random_crop = transforms.RandomCrop((224, 224)) # 对图像进行RandomCrop转换
image=Image.open('example.jpg') random_cropped_image = random_crop(image)

3结语

torchvision.trantransform是PyTorch中用于数据预处理的模块,它提供了多种常用的数据转换操作,如缩放、裁剪、旋转等。在图像处理中,我们通常需要将不同大小的图像输入到模型中进行训练和预测。因此,我们需要对图像进行大小调整,使其具有相同的尺寸。通过使用这些函数,我们可以方便地对图像进行预处理,使其符合模型的要求。例如,在ImageNet数据集上训练卷积神经网络时,我们需要将所有图像缩放到指定的大小(224x224),并进行归一化处理。这时,我们可以使用Compose函数将这些操作组合在一起,一次性完成所有的预处理操作。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/18 4:13:47

【课程设计/毕业设计】基于springboot高校师资管理系统基于java+springboot高校师资教师人事后勤管理系统【附源码、数据库、万字文档】

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

作者头像 李华
网站建设 2026/4/17 3:43:03

【课程设计/毕业设计】基于SpringBoot的社区健身公园管理系统基于springboot公园管理系统【附源码、数据库、万字文档】

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

作者头像 李华
网站建设 2026/4/17 12:26:01

17、雾计算网络中的分布式计算卸载与强化学习资源分配

雾计算网络中的分布式计算卸载与强化学习资源分配 1. 分布式计算卸载框架 DISCO DISCO 是一种用于异构全卷积网络(FCNs)的分布式计算卸载框架,借助匹配理论来减少任务执行延迟。在雾计算环境中,雾计算设备复杂多样,任务类型也各不相同,DISCO 是实现减少执行延迟的有效卸…

作者头像 李华
网站建设 2026/4/17 12:06:54

ITK-SNAP医学图像分割完全指南:从入门到精通的7大核心技巧

ITK-SNAP医学图像分割完全指南:从入门到精通的7大核心技巧 【免费下载链接】itksnap ITK-SNAP medical image segmentation tool 项目地址: https://gitcode.com/gh_mirrors/it/itksnap 医学图像分割是医学影像分析中的关键技术环节,而ITK-SNAP作…

作者头像 李华
网站建设 2026/4/17 8:04:10

3步掌握免费MIDI编辑器:从零开始你的音乐创作之旅

3步掌握免费MIDI编辑器:从零开始你的音乐创作之旅 【免费下载链接】midieditor Provides an interface to edit, record, and play Midi data 项目地址: https://gitcode.com/gh_mirrors/mi/midieditor 还在为复杂的音乐制作软件发愁吗?这里有一款…

作者头像 李华