전체 글 (66) 썸네일형 리스트형 [논문 리뷰] Fast R-CNN Fast R-CNN Submit : Girshick, R. (2015). Paper : https://arxiv.org/pdf/1504.08083.pdf Code : https://github.com/rbgirshick/fast-rcnn 1. Method 한 image에 대하여 Deep Convolution Network(논문에선 VGG의 fc6)를 이용해 feature map을 추출한다. Object가 있을 법한 후보군인 region of interest(RoI)를 추출한다. 후보군은 R-CNN과 마찬가지로 selective search를 사용하여 추출. RoI pooling layer: RoI 영역의 일부라도 포함하고 있는 feature들을 각각 Max Pooling한다. RoI feature vec.. [논문 리뷰] You Only Look Once: Unified, Real-Time Object Detection Submit : Redmon, Joseph, et al. CVPR (2016) Paper : www.cv-foundation.org/openaccess/content_cvpr_2016/html/Redmon_You_Only_Look_CVPR_2016_paper.html Code : github.com/qqwweee/keras-yolo3 0. Before Image Object Detection 방법 중 하나인 R-CNN은 속도도 느리고 최적화가 어렵다는 문제점이 있습니다. Region proposal을 한 뒤 proposal에서 분류를 하기 때문입니다. YOLO는 이미지를 일정한 개수의 grid로 나눈 뒤, 각 grid별로 object probability를 구하는 방식입니다. 각 grid에는 같은 obj.. [논문 리뷰] R-CNN: Region-based Convolution Network R. Girshick, J. Donahue, T. Darrell and J. Malik. IEEE (2015) paper: ieeexplore.ieee.org/document/7112511 물체가 있을 법한 영역을 찾아내서 CNN으로 classification을 수행하는 방법. 1. Method 이미지를 Input으로 받는다. 2000여 개의 region 후보군을 추출한다. Selective search 기법을 이용해서 region 추출 추출된 region별로 feature를 계산한다. CNN architecture를 이용하여 feature 추출 (TorontoNet, OxfordNet) 모델이 출력하는 feature는 4096 차원임. Classification을 수행한다. Region proposal.. Autoencoder Autoencoder(오토인코더)란, Input과 Output이 동일한 인공신경망을 이용해 Unsupervised Learning으로 feature를 추출하는 방법입니다. Input을 입력받아 저차원의 hidden layer를 통과하고, 다시 원래 Input을 출력하도록 모델을 학습합니다. 따라서 hidden layer에는 input 데이터가 압축되어 저장된다고 볼 수 있습니다. 즉, hidden layer의 값은 원본 데이터에서 추출된 feature입니다. 예를 들어 Word2Vec과 같이 One-hot encoding(어느 벡터에서 각각의 단어가 하나의 차원을 가지도록 인코딩) 수만~수십만 개의 단어를 200차원의 vector로 만들 때 Autoencoder를 사용할 수 있습니다. 1. AutoEnc.. 이전 1 2 3 4 5 6 7 ··· 17 다음