본문 바로가기

논문리뷰

(6)
[논문 리뷰] Image-to-Image Translation with Conditional Adversarial Networks (Pix2pix) Submit : Isola, Phillip, et al. CVPR (2017) Paper : arxiv.org/pdf/1611.07004.pdf Code : github.com/phillipi/pix2pix 0. Abstract cGAN을 이용하여 한 유형의 이미지를 다른 유형의 이미지를 변환할 수 있는 framework를 제시했습니다. GAN을 사용하기 때문에 L1, L2 loss를 사용할 때보다 더 선명한 이미지를 얻을 수 있습니다. 또한, L1 loss를 사용했기 때문에 pixel 간의 관계를 고려한 scturcted loss 개념도 적용되었습니다. 이미지의 빈 영역을 그럴싸하게 채우러면 대상 영상의 semantic을 정확하게 이해해야 합니다. 그러나, L1/L2 loss를 이용하는 것만으로는 복원..
[논문 리뷰] Learning Spatiotemporal Features with 3D Convolutional Networks Submit : Tran, Du. ICCV (2015) Paper : https://arxiv.org/pdf/1412.0767.pdf 아직 정제되지 않은 글입니다. 0. Abstract deep한 3차원의 conv network를 사용해 시공간적인 특징을 학습 3가지 특징 시공간적인 특징을 학습하기에 2D conv에 비해 3D conv가 더 적합 3D conv에서 3_3_3 conv kernel이 가장 좋은 성능을 보였다 C3D가 4개의 다른 벤치마크 중에서 가장 뛰어난 성능을 보였다 특징이 명확 단지 10차원에서 UCF101에서 52.8%의 정확도를 보였다. 빠른 conv 추론덕에 계산하기 효율이 좋다. 개념적으로 아주 심플하고 학습시키지 쉽다 1. Introduction video를 이해하는 것에서는..
[논문 리뷰] Adversarial Examples Are Not Bugs, They Are Features submit: Ilyas, Andrew, et al., NIPS (2019) paper: https://arxiv.org/abs/1905.02175 1. introduction adversarial examples deep learning network는 조잡한 perturbation에 취약 ex) 돼지 -> 91돼지 / 돼지+노이즈 -> 비행기 adversarial attacks exist? model approach boundary tilting: 모델이 오버피팅되었기 때문에 boundary에 있는 데이터에 대해선 잘 동작하지 않음 local linearity: ReLU가 0 이상인 값에 대해선 linearity를 가지고 있음. data approach 이미지 앞에는 이미 로버스트하지 않은 데이터가 ..
[논문 리뷰] A Closer Look at Few shot Classification submit: Chen, Wei-Yu, et al. ICLR (2019) paper: arxiv.org/abs/1904.04232 기존의 few-shot classification 알고리즘 비교 few-shot classification에 대한 baseline 모델 제안 1. Method Few-shot classification: class당 example이 극히 적을 때 classification을 분류하는 방법 Domain Shift가 조금 있을 수 있으나, 주된 문제라고 볼 순 없다. Novel Class (새로운 class가 등장) novel data(outliers) - 다른 관측치와 비교해서 많이 벗어나 있는 관측치 많은 train data로 backbone 학습(base) --> featu..
[논문 리뷰] You Only Look Once: Unified, Real-Time Object Detection Submit : Redmon, Joseph, et al. CVPR (2016) Paper : www.cv-foundation.org/openaccess/content_cvpr_2016/html/Redmon_You_Only_Look_CVPR_2016_paper.html Code : github.com/qqwweee/keras-yolo3 0. Before Image Object Detection 방법 중 하나인 R-CNN은 속도도 느리고 최적화가 어렵다는 문제점이 있습니다. Region proposal을 한 뒤 proposal에서 분류를 하기 때문입니다. YOLO는 이미지를 일정한 개수의 grid로 나눈 뒤, 각 grid별로 object probability를 구하는 방식입니다. 각 grid에는 같은 obj..
[논문 리뷰] R-CNN: Region-based Convolution Network R. Girshick, J. Donahue, T. Darrell and J. Malik. IEEE (2015) paper: ieeexplore.ieee.org/document/7112511 물체가 있을 법한 영역을 찾아내서 CNN으로 classification을 수행하는 방법. 1. Method 이미지를 Input으로 받는다. 2000여 개의 region 후보군을 추출한다. Selective search 기법을 이용해서 region 추출 추출된 region별로 feature를 계산한다. CNN architecture를 이용하여 feature 추출 (TorontoNet, OxfordNet) 모델이 출력하는 feature는 4096 차원임. Classification을 수행한다. Region proposal..