news 2026/6/9 18:45:35

ResNet十年演进(2015–2025)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
ResNet十年演进(2015–2025)

ResNet十年演进(2015–2025)

一句话总论:
2015年ResNet还是“残差连接革命+ImageNet分类巅峰”的CNN时代开山之作,2025年ResNet已彻底退出历史舞台——全球新项目份额<1%,在中国<0.1%,被ViT/Transformer/VLA大模型全面取代。ResNet从“深度网络训练救星”沦为“博物馆经典”,其核心思想(残差学习+跳跃连接)融入现代ViT/Swin/VLA架构,推动视觉感知从“手工卷积特征”到“全局自注意力+多模态意图理解”的文明跃迁。

十年演进时间线总结
年份核心范式跃迁代表模型/参数规模ImageNet Top-1 / FPS实时性/多模态能力中国贡献/里程碑
2015ResNet残差连接元年ResNet-50/101/152 / ~25–60M~76–78% / <10 FPS离线高精度Microsoft ResNet论文,中国立即跟进
2017ResNeXt+密集连接变体ResNeXt / DenseNet / ~100M~79–81% / 10–20 FPS初步实时中国初代ResNeXt,旷视/商汤产业化起步
2019ResNet高效+移动端EfficientNet(ResNet灵感) / ~100M~84% / 20–50 FPS移动端实时地平线征程 + 华为Kirin NPU ResNet变体
2021ResNet退场+ViT取代元年ViT / Swin Transformer~88–90% / 实时初探全局注意力小鹏NGP + 华为ADS 2.0 Swin BEV取代ResNet
2023大模型时代+ResNet遗留InternImage / EVA~94% / 100+ FPS多模态初步阿里通义 + 华为盘古ViT大模型,ResNet仅遗留
2025ResNet历史经典+VLA终极形态Grok-4 Vision / DeepSeek-ViT>97% / 500+ FPS(量子加速)全域动态社交+自进化华为盘古ViT + 小鹏第二代VLA + 比亚迪天神之眼,ResNet<1%
1.2015–2018:ResNet残差革命黄金时代
  • 核心特征:ResNet残差连接解决深度网络退化,50–152层,手工堆叠,ImageNet Top-1~76–78%,离线为主,彻底终结“层数越深越差”的魔咒。
  • 关键进展
    • 2015年:Microsoft ResNet论文,152层ImageNet冠军。
    • 2016–2017年:ResNeXt分组卷积+DenseNet密集连接变体。
    • 2018年:初步实时化,中国旷视/商汤ResNet产业化。
  • 挑战与转折:局部感受野局限、手工设计瓶颈;Transformer全局注意力兴起。
  • 代表案例:ResNet-50/101人脸/检测SOTA,中国产业化领先。
2.2019–2022:ResNet高效变体+退场时代
  • 核心特征:EfficientNet复合缩放+ResNet移动端变体,ImageNet~84%,实时化,但ViT/Swin Transformer开始超越。
  • 关键进展
    • 2019年:EfficientNet(ResNet灵感)移动端高效。
    • 2020–2021年:ViT/DeiT/Swin Transformer视觉革命。
    • 2022年:地平线征程+华为昇腾车载ViT取代ResNet。
  • 挑战与转折:计算重、泛化弱;大模型+多模态VLA兴起。
  • 代表案例:小鹏NGP + 华为ADS 2.0 ViT BEV取代ResNet。
3.2023–2025:ResNet历史经典+VLA终极时代
  • 核心特征:万亿级多模态大模型+VLA端到端统一感知-语言-动作,ResNet思想(残差)融入ViT/Swin,实时毫秒级,全场景动态意图。
  • 关键进展
    • 2023年:InternImage/EVA巨型ViT,ResNet仅遗留。
    • 2024年:DeepSeek/Grok-4 Vision专用ViT,量子辅助鲁棒。
    • 2025年:华为盘古ViT + 小鹏第二代VLA + 比亚迪天神之眼,全场景动态社交ViT,ResNet新项目份额<1%。
  • 挑战与转折:黑箱/计算重;量子+大模型自进化标配。
  • 代表案例:比亚迪天神之眼(7万级全天气ViT理解),银河通用2025人形(VLA ViT动态意图视觉)。
一句话总结

从2015年ResNet残差连接的“深度网络救星”到2025年被VLA量子自进化取代的“历史经典”,十年间ResNet由CNN王者转向博物馆文物,中国主导ResNet→ViT→VLA架构创新+普惠下沉,推动视觉感知从“局部卷积特征”到“全局语义自注意力理解”的文明跃迁,预计2030年ResNet渗透率<0.1%+仅存教学。

数据来源于arXiv综述、IROS 2025及中国厂商技术白皮书。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/5 11:20:57

高效制作高质量GIF:gifski与ffmpeg完美组合方案

高效制作高质量GIF&#xff1a;gifski与ffmpeg完美组合方案 【免费下载链接】gifski GIF encoder based on libimagequant (pngquant). Squeezes maximum possible quality from the awful GIF format. 项目地址: https://gitcode.com/gh_mirrors/gif/gifski 想要轻松制…

作者头像 李华
网站建设 2026/6/5 20:25:53

终极指南:如何用Qwen-Image-Lightning实现3秒AI绘图

终极指南&#xff1a;如何用Qwen-Image-Lightning实现3秒AI绘图 【免费下载链接】Qwen-Image-Lightning 项目地址: https://ai.gitcode.com/hf_mirrors/lightx2v/Qwen-Image-Lightning 你是否曾经因为AI绘图等待时间过长而放弃创意&#xff1f;当灵感闪现时&#xff0c…

作者头像 李华
网站建设 2026/6/5 18:48:29

浏览器扩展构建终极指南:零基础制作独立自动化工具

浏览器扩展构建终极指南&#xff1a;零基础制作独立自动化工具 【免费下载链接】automa 项目地址: https://gitcode.com/gh_mirrors/aut/automa 想要将你的浏览器自动化想法快速转化为可分享的独立扩展吗&#xff1f;本文将为你揭秘从零开始构建功能完整的浏览器扩展的…

作者头像 李华
网站建设 2026/6/6 8:16:58

比zip快10倍!Linux高效压缩方案对比

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容&#xff1a; 创建一个压缩性能测试工具&#xff0c;能够自动测试zip、gzip、bzip2、xz等工具在不同文件类型上的压缩速度、压缩率和CPU占用率。要求生成可视化对比图表&#xff0c;并根据测试结…

作者头像 李华
网站建设 2026/6/6 7:08:27

PPOCRLABEL入门指南:零基础到熟练标注

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容&#xff1a; 创建一个PPOCRLABEL新手教学应用&#xff0c;包含&#xff1a;1. 分步安装指南&#xff1b;2. 基础标注操作演示&#xff1b;3. 常见问题解答&#xff1b;4. 交互式练习项目&#…

作者头像 李华
网站建设 2026/6/6 18:34:44

macOS菜单栏任务管理终极指南:Reminders MenuBar完整使用教程

macOS菜单栏任务管理终极指南&#xff1a;Reminders MenuBar完整使用教程 【免费下载链接】reminders-menubar Simple macOS menu bar application to view and interact with reminders. Developed with SwiftUI and using Apple Reminders as a source. 项目地址: https://…

作者头像 李华