news 2026/2/4 5:03:01

ResNet 残差连接:通往深层网络的“高速公路”

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
ResNet 残差连接:通往深层网络的“高速公路”

图解说明

  • 中间的直路:代表正常的学习过程,算出F(x)F(x)F(x)
  • 右边的弯路 (红色虚线):这就是“捷径”,直接把原始信息xxx传到终点。
  • 终点 (+):把新学的F(x)F(x)F(x)和原来的xxx加在一起,作为最终输出。

本文将介绍深度学习领域的一个里程碑式的发明——ResNet (残差网络)

它的核心概念**“残差连接 (Residual Connection)”,听起来很高深,但其实它的原理简单得令人发指。正是这个简单的设计,让神经网络从几十层一下子突破到了上千层**,彻底改变了 AI 的发展轨迹。

如果你完全不懂算法,没关系。我们用一个**“传话游戏”**的例子来拆解它。

1. 遇到的怪事:越努力,越倒退?

在 ResNet 出现之前(2015年以前),科学家们发现了一个非常反直觉的现象:
神经网络并不是越深越好。

按理说,层数越多,脑子越复杂,应该越聪明对吧?
但实际上,当网络层数增加到一定程度(比如 20 层增加到 50 层)时,它的表现反而变差了!准确率不升反降。

这就像你给一个学生补课:

  • 补 1 个小时,他学会了加减法。
  • 补 10 个小时,他学会了乘除法。
  • 补 100 个小时,他…学傻了,连加减法都忘了。

这就是著名的**“退化问题 (Degradation Problem)”**。因为层数太多,信息在传递过程中丢失了,或者被改乱了。


2. ResNet 的神来之笔:抄作业

为了解决这个问题,微软的何恺明大神想出了一个绝妙的主意:
“如果你学不会新的东西,至少别把旧的东西忘了!”

他在网络里加了一条**“捷径” (Shortcut),也叫“跳跃连接” (Skip Connection)**。

举个栗子 🌰

假设每一层网络都是一个学生,他们在接力处理信息。

  • 普通网络

    • 学生 A 算出结果,传给学生 B。
    • 学生 B 拿着 A 的结果一顿乱改,传给学生 C。
    • 如果 B 改错了,C 拿到的就是垃圾,后面的全完了。
  • ResNet (残差网络)

    • 学生 A 算出结果xxx
    • 学生 B 依然要去处理xxx,算出F(x)F(x)F(x)
    • 关键点来了:在 B 把结果传给 C 之前,我们把 A 的原始结果xxx直接加过去
    • 最终结果= B算出来的东西F(x)F(x)F(x)+ A原本的东西xxx

这就像是**“抄作业”**:
学生 B 对老师说:“老师,这是我自己算的答案F(x)F(x)F(x),但我怕算错了,所以我把上一位同学的正确答案xxx也附在后面。您看着办。”


3. 为什么这样就变强了?

这个简单的F(x)+xF(x) + xF(x)+x带来了两个巨大的好处:

1. 兜底机制 (至少不会变差)

如果学生 B 这一层是个笨蛋,什么都没学会(F(x)F(x)F(x)是 0 或乱码),没关系!
因为有+x+x+x在,输出结果至少还是xxx(上一层的水平)。
这就保证了:加深网络,最差也就是原地踏步,绝对不会变差(退化)。

2. 高速公路 (梯度畅通无阻)

还记得我们之前说的**“梯度消失”**吗?
在普通网络里,当老师(输出层)发现错了,想把修正意见(梯度)传回给第 1 层的学生时,必须一层一层往回传。

  • 这就像在拥堵的市区开车,每经过一个路口(层),信号就会衰减一点(被红绿灯拦住)。
  • 如果是 100 层,等传到第 1 层时,信号已经微弱到听不见了,前面的层根本收不到反馈,也就学不到东西。

ResNet 的捷径,就像是在市区旁边修了一条直达的高速公路

  • 在反向传播(挨打)的时候,误差信号可以通过这条路直接“跳”回前面的层,不用经过中间那些复杂的关卡(权重层)。
  • 这样,即使网络有 1000 层深,第 1 层也能清晰地听到第 1000 层的反馈,保证了整个团队都在有效学习。

4. 总结

ResNet (残差连接)就是给神经网络装上了**“记忆保持器”**:

  • 核心操作:输出 = 新学的 + 原来的。
  • 目的:防止层数太深导致“学傻了”或“信号断了”。
  • 结果:让我们能训练出几百层、上千层的超级网络,让 AI 的智商上限被无限拔高。

下次看到 ResNet,别被名字唬住,记得它就是那个**“允许抄上一层作业”**的机智网络!🛣️

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/3 5:24:26

Gearboy模拟器完整教程:在电脑上免费畅玩Game Boy经典游戏

Gearboy模拟器完整教程:在电脑上免费畅玩Game Boy经典游戏 【免费下载链接】Gearboy Game Boy / Gameboy Color emulator for iOS, macOS, Raspberry Pi, Windows, Linux, BSD and RetroArch. 项目地址: https://gitcode.com/gh_mirrors/ge/Gearboy 想要在电…

作者头像 李华
网站建设 2026/2/3 16:56:06

卡尔曼滤波在状态估计与噪声处理中的理论与实践

卡尔曼滤波在状态估计与噪声处理中的理论与实践 【免费下载链接】Kalman-and-Bayesian-Filters-in-Python Kalman Filter book using Jupyter Notebook. Focuses on building intuition and experience, not formal proofs. Includes Kalman filters,extended Kalman filters, …

作者头像 李华
网站建设 2026/2/3 16:56:07

免费OpenAI API密钥:零门槛解锁人工智能开发新体验

还在为AI开发的高成本发愁吗?想象一下,你手握打造智能应用的钥匙,却无需支付昂贵的费用。这正是开源社区带给我们的惊喜礼物——完全免费的OpenAI API密钥,让每个人都能轻松拥抱人工智能技术。 【免费下载链接】FREE-openai-api-k…

作者头像 李华
网站建设 2026/2/1 3:31:38

Windows 11界面个性化改造:ExplorerPatcher实用技巧大全

Windows 11界面个性化改造:ExplorerPatcher实用技巧大全 【免费下载链接】ExplorerPatcher 项目地址: https://gitcode.com/gh_mirrors/exp/ExplorerPatcher 你是否曾经因为Windows 11的界面改变而感到不适应?从任务栏的居中布局到开始菜单的全新…

作者头像 李华
网站建设 2026/2/3 18:24:07

智谱Open-AutoGLM内测权限如何获取:3个关键步骤助你快速上车

第一章:智谱Open-AutoGLM内测概览智谱AI推出的Open-AutoGLM是面向自动化自然语言处理任务的实验性平台,旨在通过大语言模型驱动的智能体实现从数据理解到模型调优的端到端流程。该平台目前处于内测阶段,主要面向科研机构与技术合作伙伴开放&a…

作者头像 李华