earticle

논문검색

부도 데이터의 불균형 문제 개선 방안 연구

초록

한국어

부도 데이터는 전체 데이터 중 극히 일부분을 차지하는 대표적인 불균형 데이터이다. 따라서 부도 예측 모형을 구축할 때는 반드시 데이터의 불균형 문제를 고려해야 한다. 본 연구는 이러한 데이터 불균형 문제 개선을 위한 Sampling 기법의 적용과 Classification Threshold 조정에 따른 부도 예측 모형의 성능 변화 양상을 정리하고, 시사점을 도출하는 것을 중심으로 진행하였 다. 실증 분석을 위해 A 은행의 소매 익스포져 데이터를 대상으로 부도 예측 모형을 구축하였고, 모형의 성능을 비교 분석하였다. 분석 결과 첫째, Sampling 기법을 적용할 경우 민감도 개선에 효과가 있음을 확인하였 고, Oversampling 기법에 비해 Undersampling 기법의 성능 개선 효과가 상대적으로 크게 나타났다. 둘째, Classification Threshold 조정 시 모형의 성능 변화 양상은 Sampling 기법을 적용하는 경우와 유사하 며, 정밀도 및 F1 Score 관점에서 Sampling 기법에 비해 상대적으로 큰 개선 효과를 확인하였다. 셋째, Sampling 기법 적용과 Classification Threshold 조정을 함께할 때 민감도 개선 효과가 가장 크게 나타남을 확인하였 다. 부도 예측 모형은 부도 계좌를 정상 계좌로 예측할 때 더 큰 위험을 초래하므로, 민감도가 가장 우수한 모형을 우선하여 활용하는 것이 바람직할 것이 다. 다만, 수익성을 제고할 필요가 있거나 투입 가능한 비용이 제한적인 상황이라면 F1 Score를 기준으로 모형을 선택하는 것이 적절할 것으로 보인다.

목차

Abstract
서론
이론적 배경
부도 예측 모형
불균형 데이터 문제 개선 기법
데이터 및 연구 방법
부도 데이터
연구 절차 및 방법
성능 평가 지표
연구 결과
Sampling 기법 적용
Classification Threshold 조정
Sampling 기법 적용 및 Classification Threshold 조정
결론
연구 결과 요약
학술적 시사점
실무적 시사점
References

저자정보

  • 박진수 동아대학교 디지털금융학과
  • 조용복 동아대학교 경영정보학과

참고문헌

자료제공 : 네이버학술정보

    함께 이용한 논문

      ※ 기관로그인 시 무료 이용이 가능합니다.

      • 4,000원

      0개의 논문이 장바구니에 담겼습니다.