원문정보
Study on the Development of an Expressway Hard Shoulder Running Algorithm Using Reinforcement Learning
초록
영어
This study applies reinforcement learning to effectively operate expressway hard shoulder running (HSR). An HSR algorithm was developed, and its effectiveness was evaluated using the VISSIM microscopic simulation program. The simulation evaluated two aspects: mobility and safety. The DQN-based HSR algorithm found speed improvement of up to 26 km/h. Compared to the current method, the difference in the number of conflicts was not significant. Considering the results, a DQN-based HSR operation has a clear effect, and it is necessary to consider adjusting the current operational criteria.
한국어
본 연구는 고속도로 상의 반복적인 교통 혼잡 문제를 해결하기 위한 현실적인 대안 중 하나 인 고속도로 갓길차로제를 효과적으로 운영하기 위해 강화학습 기법을 적용하고자 하였다. 강 화학습의 DQN을 활용한 갓길차로제 운영 알고리즘을 개발하였고 미시교통시뮬레이션 프로그 램 VISSIM을 활용하여 경부선 기흥IC-수원IC 구간의 데이터를 활용하여 강화학습 에이전트를 학습시켰고 그 효과를 평가하였다. 효과평가는 크게 이동성과 안전성의 두 가지 측면에서 진 행하였다. 분석 결과 DQN 기반 갓길차로제 운영을 통해 시간당 최대 26km/h의 속도 개선 효과 가 발생하였으며, DQN 에이전트는 기존 운영 기준인 60km/h 보다 약 10km/h 높은 속도로 갓길 차로제를 운영하였다. 안전성 효과의 경우 기존 운영 방식과 DQN 기반 운영을 통해 발생되는 차량 간 상충건수를 비교하였고 산출된 상충건수의 차이가 크지 않아 10km/h의 운영 기준 속 도의 차이가 큰 영향을 주지 않은 것으로 판단하였다. 이러한 결과를 종합적으로 고려할 때 강화학습 기반 고속도로 갓길차로제 운영은 이동성 측면에서는 분명한 효과가 존재하였고 현 재 운영 기준 속도의 조정을 고려해볼 필요가 있을 것으로 판단된다.
목차
ABSTRACT
Ⅰ. 서론
1. 연구의 배경 및 목적
2. 연구의 범위 및 절차
Ⅱ. 관련 이론 및 문헌 고찰
1. 고속도로 갓길차로제
2. 갓길차로제 관련 연구
3. 강화학습
4. 시사점
Ⅲ. 강화학습 기반 갓길차로제 운영 알고리즘 개발
1. 알고리즘 개요
2. 갓길차로제 운영 방법론
Ⅳ. 강화학습 기반 갓길차로제 운영 알고리즘 효과 평가
1. 효과 평가를 위한 시뮬레이션 네트워크 구축
2. 시뮬레이션 네트워크 정산
3. 강화학습 기반 갓길차로제 운영 효과 분석
Ⅴ. 결론 및 향후 연구과제
ACKNOWLEDGEMENTS
REFERENCES