news 2026/6/9 2:56:24

25.12.18_第P5周:运动鞋识别

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
25.12.18_第P5周:运动鞋识别

🍨 本文为🔗365天深度学习训练营中的学习记录博客

  • 🍖 原作者:K同学啊

一、我的环境

二、动态学习率

这个地方使用的是官方的动态学习率接口,最开始源代码中0.92 ** (epoch // 2),在多轮实验中,后期的模型都训练不动,loss不降我采用了Adam、标签平滑、正则化,都没有讲test_acc提升到84%。掉回头来修改衰减梯度,在最后两轮达到了最终目标,修改代码是0.95*epoch,减缓了衰减速度,让模型更容易收敛。我也不懂为啥就实现了目标,我问ai,ai建议如下。最近建议我尝试余弦退火策略,因为我的acc曲线最终还是掉了一些下去,

为什么“平滑”能提高准确率?

你可以看看这两个对比图(想象):

  1. 配合动量(Momentum)

    • 现在的优化器(如 Adam)都有“惯性”。

    • 旧方案的突变会打断惯性,导致模型在那个瞬间方向迷失。

    • 新方案顺应惯性,让模型在减速的同时依然保持方向感,更容易滑入“全局最优解”(Global Minima)。

  2. 更早的干预

    • 旧方案前 2 轮学习率完全没变。如果初始学习率这就有点大,前 2 轮可能已经跑偏了。

    • 新方案从第 1 轮就开始减速(乘以 0.95)。这种“尽早介入、温柔介入”的策略,能防止模型在训练初期因为步子太大而跳出最优解的坑。

三 代码

# # 调用官方动态学习率接口时使用 learn_rate = 1e-4 lambda1 = lambda epoch: (0.95 ** epoch) optimizer = torch.optim.SGD(model.parameters(), lr=learn_rate) scheduler = torch.optim.lr_scheduler.LambdaLR(optimizer, lr_lambda=lambda1) #选定调整方法
loss_fn = nn.CrossEntropyLoss() # 创建损失函数 epochs = 40 train_loss = [] train_acc = [] test_loss = [] test_acc = [] for epoch in range(epochs): # 更新学习率(使用自定义学习率时使用) model.train() epoch_train_acc, epoch_train_loss = train(train_dl, model, loss_fn, optimizer) # scheduler.step() # 更新学习率(调用官方动态学习率接口时使用) model.eval() epoch_test_acc, epoch_test_loss = test(test_dl, model, loss_fn) scheduler.step() train_acc.append(epoch_train_acc) train_loss.append(epoch_train_loss) test_acc.append(epoch_test_acc) test_loss.append(epoch_test_loss) # 获取当前的学习率 lr = optimizer.state_dict()['param_groups'][0]['lr'] template = ('Epoch:{:2d}, Train_acc:{:.1f}%, Train_loss:{:.3f}, Test_acc:{:.1f}%, Test_loss:{:.3f}, Lr:{:.2E}') print(template.format(epoch+1, epoch_train_acc*100, epoch_train_loss, epoch_test_acc*100, epoch_test_loss, lr)) print('Done')
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/9 8:28:49

多智能体测试自动化:AI驱动的企业级测试平台构建全攻略

本文详细介绍了如何构建基于多智能体协作(MAS)的AI驱动测试平台,通过模块化、并行化的智能体架构,解决了传统测试工具割裂、流程断层的问题。文章从MAS基础架构、工作流设计、服务封装、企业部署到DevOps集成,全方位阐述了实现从"工具驱…

作者头像 李华
网站建设 2026/6/9 19:29:53

3 年换 4 套管理系统,企业什么时候才能醒悟?

如果你是连锁企业的运营总监、集团公司的IT负责人,或是SaaS服务厂商的产品经理,这些“系统管理噩梦”大概率正在消耗团队的精力与企业的利润。 在数字化转型的赛道上,很多企业陷入“换系统—补漏洞—再换系统”的恶性循环,却忽略…

作者头像 李华
网站建设 2026/6/8 11:45:57

场效应管通电短路

场效应管通电短路是指MOS管在上电瞬间或工作过程中&#xff0c;漏极&#xff08;D&#xff09;与源极&#xff08;S&#xff09;之间失去阻断能力&#xff0c;呈现极低电阻&#xff08;通常<1Ω&#xff09;的失效状态。这是电力电子系统中最严重的故障之一&#xff0c;可能…

作者头像 李华
网站建设 2026/6/8 8:18:49

19、Samba使用指南:名称解析与额外功能配置

Samba使用指南:名称解析与额外功能配置 1. Samba名称解析概述 在NetBIOS名称服务器(NBNS)出现之前,名称解析完全依靠广播。若要获取某台机器的地址,只需在网络中广播其名称,理论上该机器会作出回应。例如,若要查找名为“fred”的机器,仍可通过广播查询来确定其是否存在…

作者头像 李华
网站建设 2026/6/8 19:46:03

无代码解决方案:解锁数字化转型的普惠路径

在数字化转型进入深水区的当下&#xff0c;企业对数字化工具的核心诉求已从“功能完备”转向“快速适配、低成本落地、业务主导”。传统代码开发模式因周期长、成本高、技术门槛高的弊端&#xff0c;难以满足中小企业和业务部门的灵活需求。无代码解决方案以可视化配置、拖拽式…

作者头像 李华
网站建设 2026/6/5 22:44:40

YMatrix 高可用详解:3 种镜像策略在节点宕机时表现有何不同?

前言 不同镜像策略如何对集群高可用表现产生影响&#xff1f; 在数据库中&#xff0c; 高可用性是保障业务连续性的核心——一旦 Primary 节点故障&#xff0c;能否快速切换到备份节点&#xff0c;直接决定了业务的“抗风险能力”。YMatrix 的 Mirror 机制正是实现这一目标的…

作者头像 李华