earticle

논문검색

기업신용등급 예측을 위한 랜덤 포레스트의 응용

원문정보

Application of Random Forests to Corporate Credit Rating Prediction

김성진, 안현철

피인용수 : 0(자료제공 : 네이버학술정보)

초록

영어

There has been a lot of research on intelligent information processing techniques to effectively and efficiently manage credit risk in the financial industry. To predict corporate credit ratings better, various algorithms of machine learning have been proposed and applied. However, the algorithms have some limitations. First of all, they are unable to give a solution for which variables in the dataset should be considered as input variables to effectively predict a dependent variable. Also, they are easily exposed to overfitting and risk being affected by outliers and noise. In addition, they are required to tune their numerous parameters. Under this background, this study proposes the application of Random Forests(RF) to overcome the weakness of the traditional techniques. RF were designed by Leo Breiman, an American statistician and professor, and are an ensemble learning technique. This algorithm has both features originating from bagging algorithm, which is to extend a single decision tree to various decision trees, and from random input selection. The benefit of our proposed algorithm is free from an overfitting issue, and both noise and outliers in the dataset cannot have an effect on it. Thus, our model can yield high accuracy in forecasting corporate credit ratings. To validate the effectiveness of RF in predicting corporate credit ratings, we applied it to a real world dataset of corporate credit rating in Korea. The data that we used for this research consisted of various financial ratios of 1,295 corporations and their corporate credit ratings. To evaluate and compare our model with traditional methods, we used the following methods: MDA(Multiple Discriminant Analysis), ANN(Artificial Neural Network) and MSVM(Multiclass SVM). Each model’s performance was calculated by predictive accuracy based on training and validation. Empirical results showed that RF outperforms other traditional methods from the perspective of prediction accuracy.

한국어

지금까지 금융기관의 신용위험관리를 효과적이고 효율적으로 수행하기 위한 지능형 기술에 대한 연구가 활발하게 이루어져 왔다. 특히 기업의 부실 예측이나 신용등급 예측 문제를 해결하는데 있어, 다양한 기계학습 분류 알고리즘들이 제안되고 적용되어 왔는데, 이들은 효과적인 입력변수 선정에 대한 해답을 제공해 주지 못하고, 과적합 및 잡음·이상치에 취약할 수 있는 위험이 있으며, 각종 모수에 대한 조정 작업이 요구되는 한계점이 있었다. 이러한 기존 기법들의 한계를 극복하기 위한 대안으로 본 연구는 랜덤 포레스트(Random Forests)의 응용을 제안한다. 미국의 통계학자 Breiman(2001)에 의해 제안된 랜덤 포레스트는 배깅(bagging)과 무작위 입력 변수 선택(random input selection)을 통해 단일 의사결정 나무를 다수의 의사결정 나무로 확장시킨 기계학습 기법이다. 랜덤 포레스트는 과적합에서 자유로우며, 잡음이나 이상치에 받는 영향이 적고, 높은 정확도를 얻을 수 있는 특징을 지닌다. 본 연구에서는 기업신용등급 예측에 랜덤 포레스트 기법을 적용해 보고, 그 성과를 전통적으로 사용되어 온 다른 기법들과 비교하여 예측성과의 개선이 있는지 확인해 보고자 하였다. 이를 위해 본 연구에서는 1,295개 국내 상장기업을 대상으로 하는 기업신용등급 평가모형 구축에 랜덤 포레스트를 적용해 보았다. 제안된 기법의 성과를 비교평가하기 위한 전통적인 분류 기법으로는 다중판별분석, 인공신경망, 다분류 SVM 모형을 사용하였다. 실증분석 결과, 제안 기법이 전통적인 기법들과 비교해, 보다 정확한 예측결과를 산출함을 확인할 수 있었다.

목차

논문초록
 I. 서론
 II. 이론적 배경
  2.1 기업신용등급 평가
  2.2 Random Forests
 III. 연구모형
 IV. 실증분석
  4.1 실험데이터
  4.2 비교모형 설정
  4.3 실험결과
 V. 결론
 참고문헌
 Abstract

저자정보

  • 김성진 Seong-jin, Kim. 국민대학교 비즈니스IT전문대학원 석사과정.
  • 안현철 Hyun-chul, Ahn. 국민대학교 비즈니스IT전문대학원 부교수

참고문헌

자료제공 : 네이버학술정보

    함께 이용한 논문

      ※ 기관로그인 시 무료 이용이 가능합니다.

      • 6,300원

      0개의 논문이 장바구니에 담겼습니다.