(논문리뷰) Fast R-CNN

2021. 9. 13. 21:07

CNN fine tuning, boundnig box regression, classification을 모두 하나의 네트워크에서 학습시키는 end-to-end 기법을 제시 -> 기존 R-CNN 대비 속도 및 성능 향상

기존 R-CNN의 경우, 입력 이미지에서 Selective search를 통해 물체가 존재할 가능성이 있는 약 2000개의 ROI(region of interest, ROI)를 찾은 후에, 모두 네트워크에 입력하여 특성을 도출 -> 많은 연산량 필요
기존 R-CNN의 경우, 모델을 한번에 학습시키지 못함

ROI pooling을 통해 고정된 사이즈의 Feature vector로 변환해준 다음 fully-connected(FC) 층에 입력함

RoI Pooling을 추가함으로써, data가 각각 softmax(classification), bbox regressor(localization)로 들어갊.

classification과 bounding box regression을 적용하여 각각의 loss를 얻어내고, 이를 back propagation하여 전체 모델을 학습시키게 된다.

RoI를 생성하기 위해선, 여전히 네트워크의 외부에서 수행되는 Selective search알고리즘이 필요함 -> 병목현상 야기됨

누구나 쉽게, 인공지능