본문 바로가기

인공지능 시작하기/Machine Learning 이해하기

(4)
게임에서의 강화학습 Reinforcement learning Reinforcement Learning(강화 학습)은 환경과 상호 작용하면서 reward를 받아 효율적인 방식으로 행동을 강화해 나가는 학습 방법이다. 이 모델이 찾아야 할 정답이 무엇인지는 모르지만, 자신이 한 행동의 reward는 알고 있기 때문에 reward의 합이 최대가 되는 방향으로 학습해 나간다. 인공지능의 예는 아니지만 자전거를 타면서 어떻게 해야 넘어지지 않는지 경험을 통해 익히는 것도 Reinforcement learning의 일종이라고 볼 수 있을 것이다. 실제로도 경험과 시행착오를 통해 익히는 것을 모티브로 해서 인공지능의 Reinforcement Learning을 만들게 되었다. Reinforcement Learning의 기본 구성 요소 S..
Clustering 군집화(Clustering) 군집화(Clustering)은 특정 데이터를 임의의 k개의 군집(Cluster)으로 나누는 방법이다. 분류와 달리 사람이 먼저 label을 달 필요가 없이, 개수만 정해 주면 알고리즘이 알아서 비슷한 데이터끼리 k개의 군집으로 모아 준다. (1) K-Means Clustering 임의로 데이터를 k개 부분집합으로 나눈다. (여기서 K를 알고 있어야 한다) 각 object에 대해 k개의 중심 object와의 거리를 구하고 그 중 가장 유사한 중심 object의 클러스터에 속하게 한다. 클러스터의 중심점을 다시 계산한다. 더 이상 클러스터 간 변화가 없을 때까지 반복한다. Elbow Method (K-Means Clustering with unknown K) 클러스터의 수를 늘려..
Classification 분류 (Classification) 분류(Classification)는 데이터를 사람이 미리 label을 달아 둔 class로 나누는 방법입니다. 데이터는 하나의 class에 속할 수도 있고, 여러 class에 속할 수도 있습니다. 사람이 매긴 label 없이 데이터를 묶는 Clustering(군집화)와는 달리, 사람이 지정한 label 기반으로 데이터를 묶는 차이점이 있습니다. 사진 분류: 사진의 object(사람, 자동차, ...)를 구분할 수 있습니다. 텍스트 분류: 텍스트의 주제 등을 분류할 수 있습니다. 음성 인식: 들어온 음성이 어떤 음절인지 분류할 수 있습니다. (1) KNN Classification KNN Classification(K-nearest neighbor classificati..
Regression Regression(회귀분석)이란, 변수와 변수 간의 관계를 유추하는 방법입니다. 데이터가 존재할 때, 그 데이터를 잘 나타낼 수 있는 함수를 추정하는 방법입니다. Regression의 종류는 Linear Regression, Logistic Regression 등이 있습니다. Linear Regression(선형 회귀분석): 선형함수를 추정하는 회귀분석입니다. Logistic Regression(로지스틱 회귀분석): 이항 분류 문제(True, False로 분류하는 문제)를 해결하는 회귀분석입니다. 이외 다항함수 등 다양한 함수로 추정하는 회귀분석이 있습니다. 문맥에 따라 Regression은 Linear Regression만을 나타내기도 합니다. Linear Regression 종속 변수 y와, 한개 ..