Research Hub

研究

本页面记录在 人工智能 (AI)光电技术 (Optoelectronics)材料分析 (Materials Analysis)半导体物理 (Semiconductor Physics) 等领域的研究动态、学术笔记及深度思考,探索跨学科前沿技术的足迹。

论文解读:UNet - 用于生物医学图像分割的卷积网络

论文解读:UNet - 用于生物医学图像分割的卷积网络

U-NetU-Net是2015年发表的用于生物医学图像分割的模型,该模型简单、高效、容易理解、容易定制,能在相对较小的数据集上实现学习。

论文:U-Net: Convolutional Networks for Biomedical Image Segmentation

阅读全文

论文解读:SSD - 单次多框检测器

论文解读:SSD - 单次多框检测器

SSD是一种One Stage的检测模型,相比于R-CNN系列模型上要简单许多。其精度与Faster R-CNN相匹敌,而速度达到59FPS,速度上超过Faster R-CNN。

论文:SSD: Single Shot MultiBox Detector

阅读全文

论文解读:YOLO - 统一实时目标检测

YOLO(You Only Look Once ),创造性的将物体检测任务直接当作回归问题来处理,将候选区和检测两个阶段合二为一。目前YOLO版本已经更新到YOLO7,另外还有许多YOLO变种。

阅读全文

论文解读:Faster R-CNN - 通过区域建议网络实现实时目标检测

论文解读:Faster R-CNN - 通过区域建议网络实现实时目标检测

Faster R-CNN结构上将特征抽取,region proposal提取,bbox regression(包围边框回归),分类都整合到了一个网络中,综合性能有较大提高,检测速度提升较大。

论文:Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks

阅读全文

论文解读:Fast R-CNN - 基于区域卷积网络的目标检测

论文解读:Fast R-CNN - 基于区域卷积网络的目标检测

Fast R-CNN基于R-CNN和SPPNets,进行模型改进。不需要再生成2000个候选区域,只需要特征提取一次,使用selective search生成2000个区域候选框,再CNN卷积,Rol池化形成特定长度特征向量,送入全连接FC,Softmax,输出定位信息。速度较R-CNN有提升,但依旧慢。

论文:Fast R-CNN

阅读全文

论文解读:ResNet - 深度残差网络用于图像识别

论文解读:ResNet - 深度残差网络用于图像识别

ResNet ImageNet LSVRC-2015竞赛冠军,152层残差网络结构,将Top5错误率降到3.57,已经超过人眼水平,此后ImageNet大赛不再举办。解决了梯度消失的问题。
ResNet 是计算机视觉发展史上最关键的模型之一。它不只是把网络做得更深,而是第一次系统性地解决了一个困扰深层神经网络很久的问题:为什么网络堆得越来越深,训练反而会变差?

论文:Deep Residual Learning for Image Recognition

阅读全文

论文解读:VGG - 用于大规模图像识别的深度卷积网络

论文解读:VGG - 用于大规模图像识别的深度卷积网络

VGG为ImageNet LSVRC-2014竞赛亚军,VGG结构简单,应用性强,广受喜爱。VGG-16、VGG-19效果较好。

论文:Very Deep Convolutional Networks for Large-scale Image Recognition

阅读全文

论文解读:AlexNet - ImageNet Classification With Deep Convolutional Neural Networks

论文解读:AlexNet - ImageNet Classification With Deep Convolutional Neural Networks

AlexNet是2012年提出的CNN模型, ImageNet LSVRC-2010竞赛冠军,具有划时代意义,在次之前主要用传统机器学习方法SVM,此后,深度学习发展迅速。AlexNet网络结构先卷积,然后全连接。有60 million个参数,65 thousand个神经元,五层卷积,三层全连接网络,输出层为1000通道的softmax。利用了GPU进行计算,大大提高了运算效率。

论文:ImageNet Classification with Deep Convolutional Neural Networks

阅读全文

论文解读:LeNet5 - 基于梯度的学习应用于文档识别

论文解读:LeNet5 - 基于梯度的学习应用于文档识别

LeNet-5是Yann LeCun在1998年提出的多层神经网络,用于解决手写数字识别的,并证明在当时该识别方法优于其他识别方法;自此,CNN的模型基本都基于该架构:卷积层、池化层、全连接层。

论文:Gradient-Based Learning Applied to Document Recognition

阅读全文