Deeeplearning模型-ObjectDetection-Faster R-CNN
条评论Faster R-CNN结构上将特征抽取,region proposal提取,bbox regression(包围边框回归),分类都整合到了一个网络中,综合性能有较大提高,检测速度提升较大。
论文:Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks
论文想解决什么问题
Faster R-CNN解决的是Fast R-CNN最后剩下的瓶颈:候选框还是靠Selective Search等外部算法生成,整套检测流程依然不够快。
核心创新
- 提出Region Proposal Network,直接在卷积特征图上生成候选框。
- 让proposal生成与目标检测共享卷积特征,减少重复计算。
- 引入anchors,把不同尺度和宽高比的候选框生成过程参数化。
结构理解
Faster R-CNN可以看成两个子网络协同工作:RPN负责“先提名哪些区域可能有目标”,Fast R-CNN检测头负责“这些区域具体是什么、框得准不准”。
它最重要的地方,是把原来独立存在的proposal步骤收进了神经网络内部,从而让整个检测框架更接近统一训练和统一推理。
实验结果怎么看
论文表明,RPN几乎以很小的额外代价就能产生高质量候选框,并使整体检测速度显著提升。Faster R-CNN也因此成为两阶段检测器的代表性框架,长期被当作高精度检测基线。
简单理解与局限
我对Faster R-CNN的理解是:它把R-CNN家族真正推到了成熟阶段。
它的局限在于,两阶段框架通常仍比轻量级一阶段方法更慢,anchors设计也会带来一些超参数负担,但在追求检测精度时,它一直是非常重要的经典方案。