Paper review (15) 썸네일형 리스트형 [논문 리뷰] Adversarial Examples Are Not Bugs, They Are Features submit: Ilyas, Andrew, et al., NIPS (2019) paper: https://arxiv.org/abs/1905.02175 1. introduction adversarial examples deep learning network는 조잡한 perturbation에 취약 ex) 돼지 -> 91돼지 / 돼지+노이즈 -> 비행기 adversarial attacks exist? model approach boundary tilting: 모델이 오버피팅되었기 때문에 boundary에 있는 데이터에 대해선 잘 동작하지 않음 local linearity: ReLU가 0 이상인 값에 대해선 linearity를 가지고 있음. data approach 이미지 앞에는 이미 로버스트하지 않은 데이터가 .. [논문 리뷰] A Closer Look at Few shot Classification submit: Chen, Wei-Yu, et al. ICLR (2019) paper: arxiv.org/abs/1904.04232 기존의 few-shot classification 알고리즘 비교 few-shot classification에 대한 baseline 모델 제안 1. Method Few-shot classification: class당 example이 극히 적을 때 classification을 분류하는 방법 Domain Shift가 조금 있을 수 있으나, 주된 문제라고 볼 순 없다. Novel Class (새로운 class가 등장) novel data(outliers) - 다른 관측치와 비교해서 많이 벗어나 있는 관측치 많은 train data로 backbone 학습(base) --> featu.. [논문 리뷰] Fast R-CNN Fast R-CNN Submit : Girshick, R. (2015). Paper : https://arxiv.org/pdf/1504.08083.pdf Code : https://github.com/rbgirshick/fast-rcnn 1. Method 한 image에 대하여 Deep Convolution Network(논문에선 VGG의 fc6)를 이용해 feature map을 추출한다. Object가 있을 법한 후보군인 region of interest(RoI)를 추출한다. 후보군은 R-CNN과 마찬가지로 selective search를 사용하여 추출. RoI pooling layer: RoI 영역의 일부라도 포함하고 있는 feature들을 각각 Max Pooling한다. RoI feature vec.. [논문 리뷰] You Only Look Once: Unified, Real-Time Object Detection Submit : Redmon, Joseph, et al. CVPR (2016) Paper : www.cv-foundation.org/openaccess/content_cvpr_2016/html/Redmon_You_Only_Look_CVPR_2016_paper.html Code : github.com/qqwweee/keras-yolo3 0. Before Image Object Detection 방법 중 하나인 R-CNN은 속도도 느리고 최적화가 어렵다는 문제점이 있습니다. Region proposal을 한 뒤 proposal에서 분류를 하기 때문입니다. YOLO는 이미지를 일정한 개수의 grid로 나눈 뒤, 각 grid별로 object probability를 구하는 방식입니다. 각 grid에는 같은 obj.. [논문 리뷰] R-CNN: Region-based Convolution Network R. Girshick, J. Donahue, T. Darrell and J. Malik. IEEE (2015) paper: ieeexplore.ieee.org/document/7112511 물체가 있을 법한 영역을 찾아내서 CNN으로 classification을 수행하는 방법. 1. Method 이미지를 Input으로 받는다. 2000여 개의 region 후보군을 추출한다. Selective search 기법을 이용해서 region 추출 추출된 region별로 feature를 계산한다. CNN architecture를 이용하여 feature 추출 (TorontoNet, OxfordNet) 모델이 출력하는 feature는 4096 차원임. Classification을 수행한다. Region proposal.. 토큰화 : Tokenize Tokenize 1) 토큰화 a. 문장으로 토큰화 nltk.tokenize.sent_tokenize : 주어진 텍스트를 개별 문장으로 토큰화. 예시import nltk from nltk.tokenize import sent_tokenize text = "a! bc. d. e? f~ g)" text2 = "hi! my name is soyoung. and you? um~ ex)" print(sent_tokenize(text)) print(sent_tokenize(text2)) * 결과['a!', 'bc.', 'd. e?', 'f~ g)'] ['hi!', 'my name is soyoung.', 'and you?&#.. 한국어 문법 짚고 넘어가기 한국어 문법 짚고 넘어가기 한국어 NLP 를 위하여 한국어 문법에 대해 조금 더 자세히 알아보도록 한다. 한국어의 상,하 개념 :문단 > 문장 > 구절(구,절) > 어절 > 단어 > 형태소 > 음절 > 음운(음소,운소) 1. 음운 말의 뜻을 구별해 주는 소리의 가장 작은 단위. 음운 = 음소 + 운소 음소 더 이상 작게 나눌 수 없는 음운론상의 최소 단위 국어의 자음, 모음 운소 단어의 의미를 분화하는 데 관여하는 음소 이외의 운율적 특징 음의 높낮이, 길이, 세기 * 자소와 음소 자소 : 글자 상의 분절표기 요소 음소 : 발음 상의 분절음 요소 ex) 국물 : ㄱㅜㄱㅁㅜㄹ 발음 상으로는 ㄱㅜㅇㅁㅜㄹ 자소 'ㄱ'은 음소 'ㄱ', 'ㅇ'와 대응 2. 음절 하나의 .. 이전 1 2 다음