Research Hub

研究

本页面记录在 人工智能 (AI)、光电技术 (Optoelectronics)、材料分析 (Materials Analysis) 及 半导体物理 (Semiconductor Physics) 等领域的研究动态、学术笔记及深度思考，探索跨学科前沿技术的足迹。

论文解读：ResNet - 深度残差网络用于图像识别

2022-11-16

ResNet ImageNet LSVRC-2015竞赛冠军，152层残差网络结构，将Top5错误率降到3.57，已经超过人眼水平，此后ImageNet大赛不再举办。解决了梯度消失的问题。
ResNet 是计算机视觉发展史上最关键的模型之一。它不只是把网络做得更深，而是第一次系统性地解决了一个困扰深层神经网络很久的问题：为什么网络堆得越来越深，训练反而会变差？

论文：Deep Residual Learning for Image Recognition

阅读全文

论文解读：VGG - 用于大规模图像识别的深度卷积网络

2022-11-16

VGG为ImageNet LSVRC-2014竞赛亚军，VGG结构简单，应用性强，广受喜爱。VGG-16、VGG-19效果较好。

论文：Very Deep Convolutional Networks for Large-scale Image Recognition

阅读全文

论文解读：AlexNet - ImageNet Classification With Deep Convolutional Neural Networks

2022-11-14

AlexNet是2012年提出的CNN模型， ImageNet LSVRC-2010竞赛冠军，具有划时代意义，在次之前主要用传统机器学习方法SVM，此后，深度学习发展迅速。AlexNet网络结构先卷积，然后全连接。有60 million个参数，65 thousand个神经元，五层卷积，三层全连接网络，输出层为1000通道的softmax。利用了GPU进行计算，大大提高了运算效率。

论文：ImageNet Classification with Deep Convolutional Neural Networks

阅读全文

论文解读：LeNet5 - 基于梯度的学习应用于文档识别

2022-11-12

LeNet-5是Yann LeCun在1998年提出的多层神经网络，用于解决手写数字识别的，并证明在当时该识别方法优于其他识别方法；自此，CNN的模型基本都基于该架构：卷积层、池化层、全连接层。

论文：Gradient-Based Learning Applied to Document Recognition

阅读全文