earticle

논문검색

2D 레이싱 게임 학습 에이전트를 위한 강화 학습 알고리즘 비교 분석

원문정보

Comparison of Reinforcement Learning Algorithms for a 2D Racing Game Learning Agent

이동철

피인용수 : 0(자료제공 : 네이버학술정보)

초록

영어

Reinforcement learning is a well-known method for training an artificial software agent for a video game. Even though many reinforcement learning algorithms have been proposed, their performance was varies depending on an application area. This paper compares the performance of the algorithms when we train our reinforcement learning agent for a 2D racing game. We defined performance metrics to analyze the results and plotted them into various graphs. As a result, we found ACER (Actor Critic with Experience Replay) achieved the best rewards than other algorithms. There was 157% gap between ACER and the worst algorithm.

한국어

강화 학습은 인공지능 에이전트가 비디오 게임을 학습할 때 가장 효과적으로 사용되는 방법이다. 강화 학습을 위해 여지껏 많은 알고리즘들이 제시되어 왔지만 알고리즘마다 적용되는 분야에 따라 다른 성능을 보여주었다. 본 논문 은 최근 강화 학습에서 주로 사용되는 알고리즘들의 성능이 2D 레이싱 게임에서 어떻게 달라지는지 비교 평가한다. 이 를 위해 평가에서 사용할 성능 메트릭을 정의하고 각 알고리즘에 따른 메트릭의 값을 그래프로 비교하였다. 그 결과 ACER (Actor Critic with Experience Replay)를 사용할 경우 게임의 보상이 다른 알고리즘보다 평균적으로 높은 것을 알 수 있었고, 보상 값이 가장 낮은 알고리즘과의 차이는 157%였다.

목차

요약
Abstract
Ⅰ. 서론
Ⅱ. 관련 연구
1. Asynchronous Advantage Actor-Critic (A3C)
2. Actor Critic with Experience Replay (ACER)
3. Proximal Policy Optimization (PPO)
Ⅲ. 성능 평가 방법
Ⅳ. 성능 평가
Ⅴ. 결론
References

저자정보

  • 이동철 Dongcheul Lee. 종신회원, 한남대학교 멀티미디어공학과

참고문헌

자료제공 : 네이버학술정보

    함께 이용한 논문

      ※ 원문제공기관과의 협약기간이 종료되어 열람이 제한될 수 있습니다.

      0개의 논문이 장바구니에 담겼습니다.