본문 바로가기

카테고리 없음

Deep Q-learning

반응형

Deep Q-Network(DQN)

  • Q learning을 기초로 한 강화학습
  • Q learning에서는 최적 행동 가치 함수로 최적인 행동을 정함
  • 이러한 함수를 CNN으로 비슷하게 흉내 내어 사용하는 것이 DQN

실제 사례

  • 비디오 게임을 자율 학습시켜 사람을 뛰어넘는 수준의 조작을 실현
  • 그동안의 비디오 게임 학습에서는 게임의 상태를 미리 추출하는 것이 보통. 그러나 DQN에서는 입력 데이터는 비디오 게임의 영상 뿐.
    • 게임마다 설정을 바꿀 필요 없이 단순히 DQN에 게임 영상을 보여주기만 하면 됨
  • 팩맨, 아타리와 같은 게임에서 뛰어난 성적을 보임
반응형