news 2026/5/14 0:38:32

[深度学习网络从入门到入土] 神经网络发展脉络

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
[深度学习网络从入门到入土] 神经网络发展脉络

[深度学习网络从入门到入土] 神经网络发展脉络

个人导航

知乎:https://www.zhihu.com/people/byzh_rc

CSDN:https://blog.csdn.net/qq_54636039

注:本文仅对所述内容做了框架性引导,具体细节可查询其余相关资料or源码

参考文章:各方资料

文章目录

  • [深度学习网络从入门到入土] 神经网络发展脉络
  • 个人导航
  • 源头
        • 1.感知机perceptron(1950)
        • 2.反向传播backprop
        • 3.多层神经网络MLP(1980)
  • CNN
        • 1.lenet(1998)
        • 2.alexnet(2012)
        • 3.vgg(2014)
        • 4.googlenet(2014)
        • 5.resnet(2015)
  • 序列
        • 1.rnn(1980)
        • 2.lstm(1997)
        • 3.gru(2014)
        • 4.seq2seq(2014)
        • 5.temporal attention
  • CNN for 序列
        • 1.因果Causal Conv
        • 2.空洞Dilated Conv
        • 3.TCN
        • 4.WaveNet
        • 5.InceptionTime
  • 经典统计基线
        • 1.AR
        • 2.ETS
        • 3.状态空间模型
        • 4.Prophet
  • Attention / Transformer 系
        • 1.transformer
        • 2.word2vec
        • 3.ELMo
        • 4.BERT
        • 5.GPT

源头

1.感知机perceptron(1950)
2.反向传播backprop
3.多层神经网络MLP(1980)

CNN

1.lenet(1998)
2.alexnet(2012)
3.vgg(2014)
4.googlenet(2014)
5.resnet(2015)

序列

1.rnn(1980)
2.lstm(1997)
3.gru(2014)
4.seq2seq(2014)
5.temporal attention

CNN for 序列

1.因果Causal Conv
2.空洞Dilated Conv
3.TCN
4.WaveNet
5.InceptionTime

经典统计基线

1.AR
2.ETS
3.状态空间模型
4.Prophet

Attention / Transformer 系

1.transformer
2.word2vec
3.ELMo
4.BERT
5.GPT
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 19:21:55

bge-m3 vs bge-large-zh-v1.5实测对比:云端GPU 2小时搞定选型

bge-m3 vs bge-large-zh-v1.5实测对比:云端GPU 2小时搞定选型 你是不是也遇到过这样的情况?老板突然说:“我们知识库系统要用Embedding模型,bge-m3和bge-large-zh-v1.5哪个好?两天内给结论。” 而公司既没有现成的GPU…

作者头像 李华
网站建设 2026/5/9 15:46:42

WPF 数字信号处理平台:支持 FIR/IIR、FFT 与实时绘图

前言工程教学、科研实验或嵌入式开发中,我们常常需要快速生成、分析或处理信号——比如验证一个滤波器的效果,观察 FFT 变换后的频谱,或者模拟一段带噪声的正弦波。传统做法要么依赖 MATLAB 等商业软件,要么自己写脚本绘图&#x…

作者头像 李华
网站建设 2026/5/9 13:42:34

七段数码管显示数字在高温工业现场的散热解决方案

高温工业现场七段数码管显示的散热实战:从“烧屏”到稳定运行8年的设计蜕变你有没有遇到过这样的场景?在炼钢厂的控制柜前,仪表上的数字越来越暗,甚至开始闪烁、缺笔画。巡检人员凑近才能看清温度读数——这可不是系统故障&#x…

作者头像 李华
网站建设 2026/5/10 10:34:56

声明文件:.d.ts 的编写和使用

声明文件:.d.ts 的编写和使用 欢迎继续本专栏的第二十五篇文章。在前几期中,我们已逐步深化了对 TypeScript 模块和命名空间的理解,包括 ES 模块语法的导出和导入、命名空间的分组机制,以及它们在大型项目中的组织策略。这些内容帮…

作者头像 李华
网站建设 2026/5/10 2:28:21

Qwen2.5-7B-Instruct多模态扩展:结合视觉模型应用

Qwen2.5-7B-Instruct多模态扩展:结合视觉模型应用 1. Qwen2.5-7B-Instruct 模型核心特性解析 1.1 模型架构与技术演进 Qwen2.5 是通义千问系列最新一代大语言模型,其在 Qwen2 的基础上进行了全面优化和能力增强。该系列覆盖从 0.5B 到 720B 参数规模的…

作者头像 李华
网站建设 2026/5/10 14:49:48

YOLOv13模型剪枝指南:云端低成本完成模型优化实验

YOLOv13模型剪枝指南:云端低成本完成模型优化实验 你是不是也遇到过这样的问题:作为边缘计算工程师,手头有个YOLOv13模型要优化,想试试剪枝能不能降低计算量、提升推理速度,但又不想花大价钱买高端GPU?本地…

作者头像 李华