news 2026/6/15 16:42:40

pytorch深度学习笔记16

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
pytorch深度学习笔记16

目录

摘要

1.AdaGrad

2.RMSProp

3.Adam


摘要

本篇文章继续学习尚硅谷深度学习教程,学习内容是AdaGrad,​​​​​​​RMSPropAdam

1.AdaGrad

AdaGrad(Adaptive Gradient,自适应梯度)会为每个参数适当地调整学习率,并且随着学习的进行,学习率会逐渐减小。

  • h:历史梯度的平方和

这里就表示了梯度的平方和,即,这里的表示对应矩阵元素的乘法。

使用AdaGrad时,学习越深入,更新的幅度就越小。如果无止境地学习,更新量就会变为0,完全不再更新。

AdaGrad的代码实现如下:

class AdaGrad: def __init__(self, lr=0.01): self.lr = lr self.h = None def update(self, params, grads): if self.h is None: self.h = {} for key, val in params.items(): self.h[key] = np.zeros_like(val) for key in params.keys(): self.h[key] += grads[key] * grads[key] params[key] -= self.lr * grads[key] / (np.sqrt(self.h[key]) + 1e-7)

2.​​​​​​​RMSProp

RMSProp(Root Mean Square Propagation,均方根传播)是在AdaGrad基础上的改进,它并非将过去所有梯度一视同仁的相加,而是逐渐遗忘过去的梯度,采用指数移动加权平均,呈指数地减小过去梯度的尺度。

  • h:历史梯度平方和的指数移动加权平均
  • :权重

3.Adam

Adam(Adaptive Moment Estimation,自适应矩估计)融合了Momentum和AdaGrad的方法。

  • :学习率
  • :一次动量系数和二次动量系数
  • :迭代次数,从1开始

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/12 15:31:49

PointMAE的代码配环境+运行

PointMAE的笔记 PointMAE的代码地址 1. 环境配置 我的cuda是115安装Pointnet2_PyTorch总是失败 所以我在隔离环境中创建了cuda113的环境 参考pip 隔离环境内 安装 cuda 113 不覆盖原有的全局 cuda 115 1.1 安装torch pip install torch1.12.1cu113 torchvision0.13.1cu113…

作者头像 李华
网站建设 2026/6/14 1:46:16

Spring 事务核心知识点全梳理(编程式 + 声明式 + 注解详解)

一、事务的基础概念1. 什么是事务?事务是一组不可分割的操作集合,这组操作要么 “同时成功”,要么 “同时失败”(即 “原子性”)。比如转账时 “扣 A 账户钱 加 B 账户钱”,这两步必须作为一个整体执行&am…

作者头像 李华
网站建设 2026/6/12 8:31:16

OpenCode:开源AI代理如何改变你的编程工作流

OpenCode是开源AI编码代理工具,代表AI编程从"补全"到"对话"再到"代理"的演进。它采用终端优先设计,支持多会话并行、MCP生态扩展,强调隐私与可控性。文章详解了其核心优势:开源可控、终端优先工作流…

作者头像 李华
网站建设 2026/6/12 19:54:13

大模型产业价值链深度解析:从基础设施到应用层的全景指南

大模型产业呈现四层价值链架构,当前超60%价值集中于基础设施层,未来将向MaaS服务及应用层传递。应用层分为软件平台(轻量化高毛利)和硬件载体(重投资长周期)。大模型厂商可选择开源、闭源或混合策略。基础设施层整合IDC承载、硬件算力、系统集成及软件调…

作者头像 李华