반응형
Deep Q-Network(DQN)
- Q learning을 기초로 한 강화학습
- Q learning에서는 최적 행동 가치 함수로 최적인 행동을 정함
- 이러한 함수를 CNN으로 비슷하게 흉내 내어 사용하는 것이 DQN
실제 사례
- 비디오 게임을 자율 학습시켜 사람을 뛰어넘는 수준의 조작을 실현
- 그동안의 비디오 게임 학습에서는 게임의 상태를 미리 추출하는 것이 보통. 그러나 DQN에서는 입력 데이터는 비디오 게임의 영상 뿐.
- 게임마다 설정을 바꿀 필요 없이 단순히 DQN에 게임 영상을 보여주기만 하면 됨
- 팩맨, 아타리와 같은 게임에서 뛰어난 성적을 보임
반응형