Deeeplearning模型-CNN-ResNet
ResNet ImageNet LSVRC-2015竞赛冠军,152层残差网络结构,将Top5错误率降到3.57,已经超过人眼水平,此后ImageNet大赛不再举办。解决了梯度消失的问题。
ResNet ImageNet LSVRC-2015竞赛冠军,152层残差网络结构,将Top5错误率降到3.57,已经超过人眼水平,此后ImageNet大赛不再举办。解决了梯度消失的问题。
VGG为ImageNet LSVRC-2014竞赛亚军,VGG结构简单,应用性强,广受喜爱。VGG-16、VGG-19效果较好。
论文:Very Deep Convolutional Networks for Large-scale Image Recognition
AlexNet是2012年提出的CNN模型, ImageNet LSVRC-2010竞赛冠军,具有划时代意义,在次之前主要用传统机器学习方法SVM,此后,深度学习发展迅速。AlexNet网络结构先卷积,然后全连接。有60 million个参数,65 thousand个神经元,五层卷积,三层全连接网络,输出层为1000通道的softmax。利用了GPU进行计算,大大提高了运算效率。
论文:ImageNet Classification with Deep Convolutional Neural Networks
LeNet-5是Yann LeCun在1998年提出的多层神经网络,用于解决手写数字识别的,并证明在当时该识别方法优于其他识别方法;自此,CNN的模型基本都基于该架构:卷积层、池化层、全连接层。
PyTorch是一个建立在Torch库之上的Python包,是由Facebook开源的神经网络框架。它提供一种类似NumPy的抽象方法来表征张量(或多维数组),可利用GPU来加速训练。Torch是一个经典的对多维矩阵数据进行操作的张量(tensor )库,包含自动求导系统的深度神经网络,提供了高度灵活性和效率的深度学习实验性平台。与Tensorflow的静态计算图不同,PyTorch的计算图是动态的,可以根据计算需要实时改变计算图。
TensorFlow由谷歌人工智能团队谷歌大脑(Google Brain)开发和维护的开源深度学习平台,是目前人工智能领域主流的开发平台。但从2022年6月开始,TensorFlow要被PyTorch超越,谷歌抛弃TensorFlow,主推JAX。
TensorFlow架构设计优秀,通过张量流进行数据计算和传递,可视化张量流动环节;CPU/GPU部署容易,可进行分布式计算,可跨平台;
计算机视觉在广义上是和图像相关的技术总称,包括图像采集获取,图像压缩编码,图像存储和传输,图像合成,三维图像重建,图像增强,图像修复,图像分类和识别,图像目标检测、跟踪、表达和描述,图像特征提取,图像显示和输出等。并随着图像技术的发展,计算机视觉在各种场景下得到广泛应用。
聚类(cluster)属于无监督学习;聚类是根据数据的特征,将相似度最高的样本划分到一个聚簇中;相似度的度量方式有,曼哈顿距离、欧式距离、切比雪夫距离,都可以用闵式距离公式表示;聚类算法包括:基于原型聚类,如k-means算法;基于密度聚类,如DBSCAN算法;基金层次聚类,如凝聚算法。评价指标采用轮廓系数。