Deeeplearning模型-ObjectDetection-Faster R-CNN

Faster R-CNN结构上将特征抽取,region proposal提取,bbox regression(包围边框回归),分类都整合到了一个网络中,综合性能有较大提高,检测速度提升较大。

论文:Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks

阅读全文

Deeeplearning模型-ObjectDetection-Fast R-CNN

Fast R-CNN基于R-CNN和SPPNets,进行模型改进。不需要再生成2000个候选区域,只需要特征提取一次,使用selective search生成2000个区域候选框,再CNN卷积,Rol池化形成特定长度特征向量,送入全连接FC,Softmax,输出定位信息。速度较R-CNN有提升,但依旧慢。

论文:Fast R-CNN

阅读全文

Deeeplearning模型-CNN-ResNet

ResNet ImageNet LSVRC-2015竞赛冠军,152层残差网络结构,将Top5错误率降到3.57,已经超过人眼水平,此后ImageNet大赛不再举办。解决了梯度消失的问题。

论文:Deep Residual Learning for Image Recognition

阅读全文

Deeeplearning模型-CNN-VGG

VGG为ImageNet LSVRC-2014竞赛亚军,VGG结构简单,应用性强,广受喜爱。VGG-16、VGG-19效果较好。

论文:Very Deep Convolutional Networks for Large-scale Image Recognition

Architecture of VGG

阅读全文

Deeeplearning模型-CNN-AlexNet

AlexNet是2012年提出的CNN模型, ImageNet LSVRC-2010竞赛冠军,具有划时代意义,在次之前主要用传统机器学习方法SVM,此后,深度学习发展迅速。AlexNet网络结构先卷积,然后全连接。有60 million个参数,65 thousand个神经元,五层卷积,三层全连接网络,输出层为1000通道的softmax。利用了GPU进行计算,大大提高了运算效率。

论文:ImageNet Classification with Deep Convolutional Neural Networks

Architecture of AlexNet

阅读全文

Deeeplearning模型-CNN-LeNet5

LeNet-5是Yann LeCun在1998年提出的多层神经网络,用于解决手写数字识别的,并证明在当时该识别方法优于其他识别方法;自此,CNN的模型基本都基于该架构:卷积层、池化层、全连接层。

论文:Gradient-Based Learning Applied to Document Recognition

Architecture of LeNet-5

阅读全文

Deeeplearning框架-PyTorch

PyTorch是一个建立在Torch库之上的Python包,是由Facebook开源的神经网络框架。它提供一种类似NumPy的抽象方法来表征张量(或多维数组),可利用GPU来加速训练。Torch是一个经典的对多维矩阵数据进行操作的张量(tensor )库,包含自动求导系统的深度神经网络,提供了高度灵活性和效率的深度学习实验性平台。与Tensorflow的静态计算图不同,PyTorch的计算图是动态的,可以根据计算需要实时改变计算图。

阅读全文

Deeeplearning框架-TensorFlow

TensorFlow由谷歌人工智能团队谷歌大脑(Google Brain)开发和维护的开源深度学习平台,是目前人工智能领域主流的开发平台。但从2022年6月开始,TensorFlow要被PyTorch超越,谷歌抛弃TensorFlow,主推JAX

TensorFlow架构设计优秀,通过张量流进行数据计算和传递,可视化张量流动环节;CPU/GPU部署容易,可进行分布式计算,可跨平台;

阅读全文

OpenCV-3.基于OpenCV图像处理案例

OpenCV图像处理综合案例

阅读全文

OpenCV-2.基于OpenCV图像操作

OpenCV(Open Source Computer Vision Library),是一个跨平台的计算机视觉库。OpenCV由英特尔公司发起并参与开发(美国公司还是强大),以BSD许可证授权发行,可以在商业和研究领域中免费使用。OpenCV可用于开发实时的图像处理、计算机视觉以及模式识别程序。[1][2]

OpenCV可解决增强现实、人脸识别、手势识别、人机交互、动作识别、运动追踪、物体识别、图像分割、机器人等领域问题。

阅读全文