第1章 双阶段检测

bt2-L 1.4 Faster R-CNN

在本节中,先验知识包括:

Fast R-CNN(1.3节)。

Fast R-CNN虽然实现了端到端的训练,而且通过共享卷积的形式大幅提升了R-CNN的计算速度,但是其仍难以做到实时检测,其中最大的性能瓶颈便是候选区域的计算。在之前的目标检测算法中,选择性搜索是最常用的候选区域提取方法,它贪心地根据图像的低层特征合并超像素(super pixel)。另一个更快速的方式是EdgeBoxes,虽然EdgeBoxes的候选区域提取速度达到了5张/秒,但仍然难以做到在视频数据上的实时检测,而且EdgeBoxes为了提取速度牺牲了提取效果。选择性搜索提取速度慢的一个重要原因是,不同于检测网络使用GPU进行计算,选择性搜索使用的是CPU。从工程的角度来讲,使用GPU实现选择性搜索是一个非常有效的方法,但是其忽视了共享卷积提供的非常有效的图像特征。