본문 바로가기

Paper review/Vision

[논문 리뷰] R-CNN: Region-based Convolution Network

반응형

물체가 있을 법한 영역을 찾아내서 CNN으로 classification을 수행하는 방법.

1. Method

  1. 이미지를 Input으로 받는다.
  2. 2000 개의 region 후보군을 추출한다.
    Selective search 기법을 이용해서 region 추출
  3. 추출된 region별로 feature 계산한다.
    CNN architecture 이용하여 feature 추출 (TorontoNet, OxfordNet) 모델이 출력하는 feature 4096 차원임.
  4. Classification 수행한다.
    Region proposal별로 추출된 4096차원 feature 가지고 Linear SVM 수행.
    Object 있는지, 있다면 어떤 object인지 classification한다.

(1) Selective search

이미지를 최대한 작은 단위로 나눈 , color, texture, size, fill 요소를 이용해 유사한 region들을 합쳐 가면서 region 추출하는 방법

(2) Object category classifier 대한 세부사항

  • CNN에서 나온 4096차원짜리 feature 이용해 linear SVM 수행.
  • Region proposal 실제로 object 있는지, object 있다면 어떤 object 있는지 classification 수행한다.
  • Region object 일부만을 포함하고 있을 : IoU overlap threshold 0.3 이상일 때만 positive 보아서 validation 수행

(3) Localization 대한 세부사항

  • Region proposal 물체가 중앙에 있지 않아도 CNN 높은 classification score 예측하는 만큼, 물체의 정확한 위치를 찾아내기에 부족한 면이 있다
  • Bounding-box regression 이용해 region 위치를 보정해 있다.
반응형