news 2026/3/14 7:47:21

pytorch框架训练、推理、模块冻结等各种细节说明

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
pytorch框架训练、推理、模块冻结等各种细节说明

1.张量的requires_grad属性

importtorch x=torch.randn(3,3,requires_grad=False)y=x*2# y = 2xy.requires_grad=Truez=y.mean()# z=(1/9)*(2x),微分是dz/dx = 2/9# z=(1/9)*y,微分是dz/dy = 1/9z.backward()print(x,x.requires_grad)print(y,y.requires_grad,y.grad)print(z.requires_grad)

注意,python中万物都是对象(object),因此基本上都会有一些属性,类比C++中类和对象的关系。张量也是一种对象。

这里对张量的核心属性requires_grad功能进行演示。例子中,x不需要梯度,因此计算得到的y也是不需要梯度的张量,我们可以手动设置y需要梯度,因此影响到z,z变为需要梯度的。

运行结果:

tensor([[-0.2486,1.0678,0.6611],[0.3205, -0.4081, -0.5011],[-1.1482,1.5839, -0.3978]])False tensor([[-0.4972,2.1357,1.3223],[0.6411, -0.8162, -1.0023],[-2.2964,3.1677, -0.7956]],requires_grad=True)True tensor([[0.1111,0.1111,0.1111],[0.1111,0.1111,0.1111],[0.1111,0.1111,0.1111]])True

2.model.train()和model.eval()对模型的行为影响

先搭建一个简单模型

importtorchimporttorch.nnasnn torch.random.manual_seed(42)classSimpleModel(nn.Module):def__init__(self):super(SimpleModel,self).__init__()self.fc=nn.Linear(10,2)# 一个简单的线性层self.bn=nn.BatchNorm1d(2)# 批量标准化self.dropout=nn.Dropout(0.5)# Dropout层,50%的丢弃概率defforward(self,x):x=self.fc(x)# 通过全连接层x=self.bn(x)# 进行批量标准化x=self.dropout(x)# 应用Dropoutreturnx# 创建模型model=SimpleModel()

2.1 获取模型的全部参数

使用方法state_dict()

print(model.state_dict())

返回一个字典

OrderedDict([('fc.weight', tensor([[-0.0290, -0.2516, -0.3142, -0.2079,0.2460, -0.1968, -0.1554, -0.2758,0.2958,0.3105],[0.2236, -0.0511,0.2169,0.2815,0.1189, -0.2317,0.1405,0.2883,0.2088, -0.2837]
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/13 0:53:18

以品质之道,养铸铁试验平台之生生不息

铸铁试验平台的国家标准的制定和执行对于整个行业的发展和进步具有重要的推动作用。通过严格执行国家标准,可以有效地提高铸铁试验平台的质量和安全性能,保障相关行业的生产和使用安全。同时,国家标准的制定也可以促进相关行业的技。 铸铁试验…

作者头像 李华
网站建设 2026/3/12 23:43:13

LobeChat能否实现AI铸剑师?冷兵器工艺复原与战斗效能分析

LobeChat能否实现AI铸剑师?冷兵器工艺复原与战斗效能分析 在博物馆的展柜前,一位观众轻声问道:“这把唐刀当年是怎么锻造出来的?” 如果这时玻璃中的古剑能“开口”讲述它的淬火温度、折叠次数和战场传奇,那会是怎样一…

作者头像 李华
网站建设 2026/3/13 0:53:04

【完整源码+数据集+部署教程】签名检测系统源码分享[一条龙教学YOLOV8标注好的数据集一键训练_70+全套改进创新点发刊_Web前端展示]

一、背景意义 随着信息技术的迅猛发展,数字化和自动化在各个领域的应用愈加广泛,尤其是在金融、法律和商业等行业中,签名作为一种重要的身份验证手段,其安全性和可靠性受到越来越多的关注。传统的手工签名验证方法不仅耗时耗力&am…

作者头像 李华
网站建设 2026/3/12 23:43:24

【计算机毕业设计案例】基于springBoot茶叶销售管理系统设计与实现基于Java语言的茶叶销售系统的前端设计与实现(程序+文档+讲解+定制)

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

作者头像 李华
网站建设 2026/3/12 23:43:37

item_get_pro-获得JD商品详情京东API接口

京东商品详情 Pro 接口(以下简称 “Pro 接口”)是京东开放平台 / 京东联盟提供的高级版商品数据接口,相比基础版接口,可返回更全维度的商品信息(如 SKU 级价格、精细化参数、多维度图片 / 视频、营销信息、库存详情等&…

作者头像 李华
网站建设 2026/3/13 0:49:28

国际网络公司如何选择?业务场景才是关键

在当今这个数字化转型的时代,找到一家合适的国际网络公司对于任何想要在全球范围内扩展其业务的企业来说都至关重要。然而,在琳琅满目的选项面前,许多决策者可能会感到迷茫。毕竟,每家公司都有其独特的优势和局限性,而…

作者头像 李华