earticle

논문검색

Diffusion 기반 분류 모델을 이용한 프로야구 지명 예측을 위한 고교야구 투수의 잠재력 분류 연구

원문정보

A study on the classification of high school baseball pitchers' potentiality for professional baseball draft prediction using a diffusion-based classification model

오영환

피인용수 : 0(자료제공 : 네이버학술정보)

초록

영어

This study aims to develop a predictive model to determine the likelihood of high school baseball pitchers being drafted into professional leagues based on their performance records. To achieve this, we propose a multi-class classification model that leverages the principle of diffusion modeling, wherein noise is gradually added to the training data during training, and a multi-layer perceptron (MLP) network is trained to denoise the input. The model incorporates a Softmax activation function at the output layer to classify pitchers into one of three categories: highly likely, possible, or unlikely to be drafted. The input features used in the model include core pitching statistics such as Earned Run Average (ERA), Batting Average Against (BAA), and Strikeouts per Nine Innings (K/9), as well as other quantitative indicators like pitching velocity, number of appearances, and innings pitched ratio. Furthermore, the model explores the potential of diffusion-based approaches to quantify and calibrate prediction uncertainty, offering a new perspective on how generative modeling techniques can enhance the reliability of classification outcomes. The proposed model can be utilized as a tool to support objective decision-making in future professional baseball scouting and player evaluation processes.

한국어

본 연구는 고교야구 투수의 경기 기록 데이터를 활용하여 프로야구 지명 여부를 예측하는 머신러닝 기반 분류 모델 을 개발하는 것을 목표로 한다. 이를 위하여 최근 생성 모델링 분야에서 주목받는 Diffusion 모델의 원리를 도입하 고, 학습 데이터에 점진적으로 노이즈를 주입한 후 다층 퍼셉트론(MLP) 기반 네트워크를 통해 이를 제거하는 과정 을 학습하는 조건부 노이즈 예측 모델을 설계하였다. 본 모델은 소프트맥스(Softmax) 함수를 출력층에 적용한 다 중 클래스 분류 구조로, 고교 투수의 프로 지명 가능성을 '유력', '가능', '어려움'의 세 가지 범주로 예측한다. 모델 입력에는 평균자책점(ERA), 피안타율(BAA), 9이닝당 탈삼진 수(K/9)를 포함한 주요 투수 지표뿐만 아니라, 구 속, 이닝 소화율, 경기 출장 수 등 다양한 정량적 통계 지표가 활용된다. 나아가, Diffusion 모델의 구조적 특성을 통해 예측 과정에서의 불확실성을 정량화하고, 이를 기반으로 보다 신뢰성 있는 예측 결과를 도출할 수 있는 가능성 을 탐색하였다. 제안된 모델은 향후 프로야구 스카우팅 및 선수 평가 과정에서 객관적인 의사결정을 지원하는 도구로 활용될 수 있다.

목차

요약
Abstract
1. 서론
2. 관련 연구
2.1 머신러닝 기법
2.2 Diffusion 모델의 분류 기법
3. 다층 퍼셉트론 예측모델
3.1 다층 퍼셉트론 모델
3.2 Diffusion Models for Uncertainty Calibration
3.3 훈련 데이터
4. 구현 및 실험 결과
4.1 학습 데이터
4.2 실험 구현
4.3 실험 결과와 논의
5. 결론
감사의 글
참고문헌

저자정보

  • 오영환 Young Hwan Oh. 나사렛대학교 IT인공지능학부

참고문헌

자료제공 : 네이버학술정보

    함께 이용한 논문

      0개의 논문이 장바구니에 담겼습니다.