Mask R-CNN 演变笔记
前言目标检测分为两种方法:一阶段法和两阶段法。一阶段法的代表算法为YOLO,SSD,具有速度快的优势。所谓两阶段法就是先找出图像中的region proposal ,再分别对每个proposal进行回归和分类,它的优势则是精确度高,Mask R-CNN则是这一方法,从一开始的R-CNN到Fast R-CNN再到Faster R-CNN,FPN,到最后的Mask R-CNN,演进过程中的一些方法依旧用于其他的机器视觉任务中,所以这个路线中的网络架构和方法非常值得我们去学习。
Sliding windows
这是目标检测的最早期的算法——滑动窗口法,很好理解,就是固定一个窗口(不同的size 和长宽比)从左向右,从上到下的去滑动,对每个窗口的图像进行目标识别与分类。这种方法可想而知,非常耗时。
R-CNN2014年的时候随着深度学习的兴起,R-CNN横空出世了。与滑动窗口法不同,这里使用selective search 这种 region proposal method 来提取图像的RoIs (感兴趣区域)。这里我们可以看下这种方法的思想,相似的像素、纹理或者是灰度等会被归为一个区域,并得 ...