최근 심화 학습(Deep Learning)과 기계 학습(Machine Learning)이 주목 받으면서 이를 지원하는 다양한 Frameworks가 등장했다. 인공지능 분야에서는 이를 이용해 복잡한 문제 해결에 적용하는 연구가 활발히 진행되고 있다. 이에 따라 다양한 알고리즘과 학습 방법론을 적용한 인공지능 시스템에 대한 연구가 요구되고 있다.
본 논문에서는 학습 환경으로부터 수집한 픽셀 데이터를 이용해 스스로 판단을 내리는 Agent(Decision Making Agent)를 구현한다. 강화 학습(Reinforcement Learning)의 대표적 가치 기반 알고리즘인 DQN(Deep Q-Networks)과 정책 기반 학습 알고리즘 PG(Policy Gradient)를 사용한 학습의 성능을 분석하고 그 차이를 알아본다. 픽셀 데이터로부터 특이점 추출을 위해 CNN(Convolutional Neural Networks)을 사용하고 전체 학습 성능에 미치는 영향을 알아본다.
본 논문은 픽셀 데이터로부터 특이점을 찾아, 효율적으로 답을 찾아가는 인공지능 시스템 연구에 기여 할 수 있을 것으로 판단된다.