원문정보
Improving prediction ability of Team Runs for machine learning regression model with player composition information by grade in KBO(Korea Baseball Organization)
초록
영어
Baseball is a sport in which a runner can get “Runs” only when there is a batter who raises an RBI. And since each batter receives equal opportunities to bat, it is impossible to funnel more offensive opportunities into a standout player. Therefore, player composition is particularly important. In this study, we checked whether the batter composition information could be usefully used to predict team runs more accurately. Players were given a grade for each evaluation index based on individual evaluation indicators. Such as batting average(AVG), on-base percentage(OBP), slugging percentage(SLG), OPS(On-Base Plus Slugging), wOBA(weighted On Base Average), wRC+(Weighted Runs Created), and the player distribution information for each grade was used to predict team runs. As a result of the experiment, it was confirmed that the team runs were predicted more accurately if we used the player distribution information by grade with team's batting statistics than used only team's batting statistics. The method proposed in this study considers the number of players in each grade to predict the team's scoring ability. So it is useful not only in improving prediction accuracy but also in predicting the level of the team's scoring ability hierarchically among teams with similar statistic values.
한국어
야구는 “타점”을 해주는 타자가 있어야 주자가 “득점”을 할 수 있고, 타순별로 균등하게 공격 기회를 부여받는다는 특 징이 있다. 이러한 특징은 공격이 우수한 선수에게 공격 기회를 집중시킬 수 없다는 것을 의미하는데, 그렇기 때문 에 선수 구성이 특히 중요한 종목이다. 본 연구에서는 이 선수 구성 정보가 팀 득점 예측력을 높이는 데에 유용하게 사용될 수 있는지를 확인해 보았다. 타율(AVG), 출루율(OBP), 장타율(SLG), OPS(On-Base Plus Slugging), wOBA(Weighted On Base Average), wRC+(Weighted Runs Created) 등의 개인별 평가지표를 기준으로 선수들에게 각각의 평가지표별 등급을 부여하고, 이 등급별 선수 분포 정보를 팀 득점 예측에 사용하였다. 실험 결 과, 등급별 선수 분포 정보를 팀 공격력 통계와 함께 사용하여 팀 득점을 예측하면, 팀 통계만을 사용하여 예측하는 것보다 더 정확하게 팀 득점을 예측하였다. 본 연구에서 제안하는 방법은, 각 통계 항목별로 어떤 등급의 선수들이 몇 명씩 있는지 까지를 고려하여 팀 득점을 예측하는 방법이므로, 예측력을 높여줄 뿐만 아니라, 팀 통계가 비슷한 팀들 사이에서 팀 득점에 대한 우열을 예측하고자 할 때 유용하게 사용할 수 있다.
목차
Abstract
1. 서론
2. 관련 연구
2.1 타자 평가지표에 관련된 연구
2.2 팀 득점에 관련된 연구
2.3 기계학습을 야구 데이터에 적용한 연구
3. 기계학습 모델을 활용한 팀 득점 예측방법 제안
3.1 평가지표의 등급 분류 방법
3.2 평가지표 종류 및 회귀 변수 설정
3.3 모델 구축 절차
3.4 팀 득점 예측 제안 모델
4. 실험 및 평가
4.1. 팀 득점 예측 실험 결과
4.2. 공격력이 비슷한 팀들 사이에서의 우위 예측
5. 결론 및 향후 연구
Acknowledgement
참고문헌
