딥러닝 (3) 썸네일형 리스트형 Text Embedding Text Embedding은 사람이 이해할 수 있는 text를, 컴퓨터가 이해할 수 있는 vector 형태로 나태낸 것을 의미합니다. 본 포스트에선 통계 기반 단어 임베딩부터, Word2Vec 이전의 NNLM 모델을 거쳐 Word2vec까지 설명하겠습니다. 1. Word Embedding Word Embedding은 단어를 제한된 차원의 vector로 나타내는 방법입니다. One-hot encoding과 달리, 단어 벡터 간의 유사도를 코사인 유사도로 구할 수도 있고, 필요한 벡터 차원의 수도 적습니다. 근처에 나온 단어, 비슷한 단어일수록 벡터 간의 유사도가 높습니다. 벡터의 위치와 거리가 실제 단어 간의 관계를 반영합니다. 2. 통계 기반 단어 임베딩 2-1. 분포 가설(distributional h.. CNN(Convolution Neural Network)이란? CNN(Convolution Neural Network)는 Convolution(합성곱)을 이용해 feature를 추출하는 Layer입니다. Convolution 특성상 근처의 데이터끼리만 묶어서 처리한다는 특징이 있습니다. 1. 합성곱 계층 데이터의 형상을 유지하여 계층의 특징을 유지할 수 있습니다. 이미지의 경우 3차원(width, height, color) 형상으로 되어 있으므로, 3차원을 입력받아 3차원을 출력합니다. 합성곱 계층의 입출력 데이터를 특징 맵(feature map)이라고 합니다. 입력 데이터는 입력 특징 맵(input feature map), 출력 데이터는 출력 특징 맵(output feature map)이라고 부릅니다. (1) Convolution(합성곱) Convolution 연.. Machine Learning이란 무엇일까? 개요 머신러닝(Machine Learning)이란 무엇일까요? 또한 흔히 우리가 일컫는 인공지능, 머신러닝, 딥러닝은 무엇일까요? 인공지능은 컴퓨터 시스템을 통해 인간의 지능이 갖는 기능을 가진 것을 말합니다. 머신러닝은 이러한 인공지능을 구현하는 것 방법 중 하나입니다. 딥러닝은 머신러닝 내에서 사용하는 기술입니다. 이러한 개념을 알아둔 상태로 오늘은 머신러닝에 대해서 알아보도록 하겠습니다. 머신러닝의 분류 머신러닝을 공부하면 다양한 모델과 학습 방법을 알게 될텐데요, 이 학습 방법을 크게 분류하면 총 3가지로 나눌 수 있습니다. Supervised Learning, Unsupervised Learning, Reinforcement Learning 입니다. 1. Supervised learning (지.. 이전 1 다음