第1章 双阶段检测

1.1.6 小结

R-CNN引发了使用深度学习来进行目标检测的潮流,也留给了后续算法很多优化的空间。

重复计算:R-CNN提取了2000个候选区域,这些候选区域都要进行卷积操作,由于它们存在很多重复的区域,因此造成了大量的重复计算。

多阶段:R-CNN的候选区域提取、特征计算、分类、检测、后处理等都是独立的不同阶段,而且每个阶段都要在硬盘上存储数据,而存储这些中间数据需要几百GB的存储空间。

SVM:R-CNN并不是一个纯粹的深度学习算法,它的分类任务需要使用SVM,而SVM是一个机器学习模型,执行速度极慢。除了这些,SVM最大的问题是无法对输入它的特征进行优化,不是一个端到端的模型。

推理速度慢:R-CNN的推理速度是非常慢的,它在GPU上处理一幅图像需要10s以上的时间,这意味着其很难实现商用。