- (66) 썸네일형 리스트형 [논문 리뷰] Quo Vadis, Action Recognition? A New Model and the Kinetics Dataset Quo Vadis, Action Recognition? A New Model and the Kinetics Dataset Submit : Shi, Baoguang, Xiang Bai, and Cong Yao.CVPR(2017) Paper : https://arxiv.org/abs/1507.05717 Code : https://github.com/deepmind/kinetics-i3d 1. introduction imagenet으로 이미지 분류를 하면서 알게된게 굉장히 큰 데이터셋으로 프리트레이닝하면 다른 도메인의 문제로도 확대 적용하는데 굉장히 많은 도움 된다 네트워크 구조 바뀌어도 도움된다 큰 비디오 데이터셋이 있다면 → 프리트레이닝으로 퍼포먼스 높일 수 있지 않을까 kinetics라는 큰 비디오 데이.. [논문 리뷰] Character Aware Neural Language Models Submit: Yoon Kim, AAAI (2016) Paper : https://arxiv.org/pdf/1508.06615.pdf 1. Abstract CNN, highway network, LSTM, RNN-LM을 사용했다. 60%적은 파라미터를 사용해도 높은 성능을 낸다 형태소가 많은 언어에서 유리하다 (아랍어, 체코어, 프랑스어..) character inputs는 언어모델링에 충분하다 2. Conclusion character level의 인풋만을 넣는 모델을 소개했다 매개변수가 적음에도 불구하고 이 모델은 인풋 레이어에서 단어/형태소 임베딩을 이용하는 기존 모델보다 우수 모델에 단어 임베딩이 꼭 필요한지에 대한 의문을 제기했다 3. Introduction 배경지식 언어 모델은 확률 분포로 공.. [논문 리뷰] Adversarial Examples Are Not Bugs, They Are Features submit: Ilyas, Andrew, et al., NIPS (2019) paper: https://arxiv.org/abs/1905.02175 1. introduction adversarial examples deep learning network는 조잡한 perturbation에 취약 ex) 돼지 -> 91돼지 / 돼지+노이즈 -> 비행기 adversarial attacks exist? model approach boundary tilting: 모델이 오버피팅되었기 때문에 boundary에 있는 데이터에 대해선 잘 동작하지 않음 local linearity: ReLU가 0 이상인 값에 대해선 linearity를 가지고 있음. data approach 이미지 앞에는 이미 로버스트하지 않은 데이터가 .. [논문 리뷰] A Closer Look at Few shot Classification submit: Chen, Wei-Yu, et al. ICLR (2019) paper: arxiv.org/abs/1904.04232 기존의 few-shot classification 알고리즘 비교 few-shot classification에 대한 baseline 모델 제안 1. Method Few-shot classification: class당 example이 극히 적을 때 classification을 분류하는 방법 Domain Shift가 조금 있을 수 있으나, 주된 문제라고 볼 순 없다. Novel Class (새로운 class가 등장) novel data(outliers) - 다른 관측치와 비교해서 많이 벗어나 있는 관측치 많은 train data로 backbone 학습(base) --> featu.. [논문 리뷰] Fast R-CNN Fast R-CNN Submit : Girshick, R. (2015). Paper : https://arxiv.org/pdf/1504.08083.pdf Code : https://github.com/rbgirshick/fast-rcnn 1. Method 한 image에 대하여 Deep Convolution Network(논문에선 VGG의 fc6)를 이용해 feature map을 추출한다. Object가 있을 법한 후보군인 region of interest(RoI)를 추출한다. 후보군은 R-CNN과 마찬가지로 selective search를 사용하여 추출. RoI pooling layer: RoI 영역의 일부라도 포함하고 있는 feature들을 각각 Max Pooling한다. RoI feature vec.. [논문 리뷰] You Only Look Once: Unified, Real-Time Object Detection Submit : Redmon, Joseph, et al. CVPR (2016) Paper : www.cv-foundation.org/openaccess/content_cvpr_2016/html/Redmon_You_Only_Look_CVPR_2016_paper.html Code : github.com/qqwweee/keras-yolo3 0. Before Image Object Detection 방법 중 하나인 R-CNN은 속도도 느리고 최적화가 어렵다는 문제점이 있습니다. Region proposal을 한 뒤 proposal에서 분류를 하기 때문입니다. YOLO는 이미지를 일정한 개수의 grid로 나눈 뒤, 각 grid별로 object probability를 구하는 방식입니다. 각 grid에는 같은 obj.. [논문 리뷰] R-CNN: Region-based Convolution Network R. Girshick, J. Donahue, T. Darrell and J. Malik. IEEE (2015) paper: ieeexplore.ieee.org/document/7112511 물체가 있을 법한 영역을 찾아내서 CNN으로 classification을 수행하는 방법. 1. Method 이미지를 Input으로 받는다. 2000여 개의 region 후보군을 추출한다. Selective search 기법을 이용해서 region 추출 추출된 region별로 feature를 계산한다. CNN architecture를 이용하여 feature 추출 (TorontoNet, OxfordNet) 모델이 출력하는 feature는 4096 차원임. Classification을 수행한다. Region proposal.. Autoencoder Autoencoder(오토인코더)란, Input과 Output이 동일한 인공신경망을 이용해 Unsupervised Learning으로 feature를 추출하는 방법입니다. Input을 입력받아 저차원의 hidden layer를 통과하고, 다시 원래 Input을 출력하도록 모델을 학습합니다. 따라서 hidden layer에는 input 데이터가 압축되어 저장된다고 볼 수 있습니다. 즉, hidden layer의 값은 원본 데이터에서 추출된 feature입니다. 예를 들어 Word2Vec과 같이 One-hot encoding(어느 벡터에서 각각의 단어가 하나의 차원을 가지도록 인코딩) 수만~수십만 개의 단어를 200차원의 vector로 만들 때 Autoencoder를 사용할 수 있습니다. 1. AutoEnc.. 이전 1 2 3 4 5 ··· 9 다음