(1) Hypothesize Bounding Boxes (Proposals - Selective Search)
(2) Resampling pixels, features for each boxes
(3) Classifier, Bounding Box Regressor
- AlexaNet 사용 224 x 22x 강제 warping : 성능 ↓
- Selective search 통해 2,000개 image proposal all input : 소요 시간 ↑
- Selective search & SVM은 GPU 사용 적합 구조 X
- Computation share X : No back propagation
(1) RoI pooling : feature map에 이전 RoI projection, RoI를 FC layer input 크기에 맞게 고정된 크기로 변형 가능
(2) FCL → Classifier, Bounding Box Regressor 동시 학습
- Region Proposal을 CNN Network가 아닌 Selective search 외부 수행 : 병목 현상
(1) Region proposal Networks(RPN) : input-Featrue Map, output-Object proposal의 Sample
- Region Proposal을 CNN Network 내부 수행 & GPU 연산 : 소요 시간 ↓