论文解读:ResNet - 深度残差网络用于图像识别
ResNet ImageNet LSVRC-2015竞赛冠军,152层残差网络结构,将Top5错误率降到3.57,已经超过人眼水平,此后ImageNet大赛不再举办。解决了梯度消失的问题。
ResNet 是计算机视觉发展史上最关键的模型之一。它不只是把网络做得更深,而是第一次系统性地解决了一个困扰深层神经网络很久的问题:为什么网络堆得越来越深,训练反而会变差?
Research Hub
本页面记录在 人工智能 (AI)、光电技术 (Optoelectronics)、材料分析 (Materials Analysis) 及 半导体物理 (Semiconductor Physics) 等领域的研究动态、学术笔记及深度思考,探索跨学科前沿技术的足迹。
ResNet ImageNet LSVRC-2015竞赛冠军,152层残差网络结构,将Top5错误率降到3.57,已经超过人眼水平,此后ImageNet大赛不再举办。解决了梯度消失的问题。
ResNet 是计算机视觉发展史上最关键的模型之一。它不只是把网络做得更深,而是第一次系统性地解决了一个困扰深层神经网络很久的问题:为什么网络堆得越来越深,训练反而会变差?
VGG为ImageNet LSVRC-2014竞赛亚军,VGG结构简单,应用性强,广受喜爱。VGG-16、VGG-19效果较好。
论文:Very Deep Convolutional Networks for Large-scale Image Recognition
AlexNet是2012年提出的CNN模型, ImageNet LSVRC-2010竞赛冠军,具有划时代意义,在次之前主要用传统机器学习方法SVM,此后,深度学习发展迅速。AlexNet网络结构先卷积,然后全连接。有60 million个参数,65 thousand个神经元,五层卷积,三层全连接网络,输出层为1000通道的softmax。利用了GPU进行计算,大大提高了运算效率。
论文:ImageNet Classification with Deep Convolutional Neural Networks
LeNet-5是Yann LeCun在1998年提出的多层神经网络,用于解决手写数字识别的,并证明在当时该识别方法优于其他识别方法;自此,CNN的模型基本都基于该架构:卷积层、池化层、全连接层。