원문정보
Analysis on Corporate Credit Scoring Models and Key Financial Variables Using Machine Learning
초록
영어
In the modern financial market, credit evaluation is essential for evaluating the financial soundness of individuals, companies, and countries, and for loan screening and risk management of financial institutions, but the rapidly changing market economy and the development of machine learning technology have revealed the limitations of existing models. This study analyzed the credit rating data and financial data of manufacturing companies evaluated by Korea Enterprise Assessment from 2010 to 2024 and derived the importance of key financial variables through machine learning techniques such as Random Forest, XGBoost, and CatBoost, and combined them to improve credit risk prediction. SMOTE was applied to solve the problem of data imbalance, and SHAP was used to identify the direction and change interval of the impact of key financial variables on credit risk through XAI techniques. The results showed that the key financial variables differed between the realized credit risk and the implied credit risk assessed by traditional methods. This suggests the need for new evaluation criteria for high credit-risk companies. We also visualized the credit rating transition and found that companies that transitioned to high credit risk had difficulty recovering. These findings suggest potential improvements to machine learning-based credit rating models and provide a basis for financial institutions to better manage credit risk.
한국어
현대 금융시장에서 신용평가는 개인, 기업, 국가의 금융건전성 평가 및 금융 기관의 대출 심사나 리스크 관리에 필수적이나, 급변하는 시장경제 변화와 머신러닝 기술의 발전으로 기존 모형의 한계가 드러나고 있다. 본 연구는 2010년부터 2024년까지 한국기업평가에서 평가한 제조업 기업의 신용등급 자료와 재무 데이터를 분석하여, Random Forest, XGBoost, CatBoost 등 머신러닝 기법을 통해 주요 재무 변수들의 중요도를 도출하고, 이를 결합하여 신용위험 예측력을 향상시키고자 하였다. 이때, 데이터 불균형 문제를 해결하기 위해 SMOTE를 적용하였으며, XAI 기법 중 SHAP을 통해 주요 재무 변수들이 신용위험에 미치 는 영향의 방향 및 변화 구간을 확인하였다. 연구 결과, 실현된 신용위험과 기존 방식으로 평가된 내재적 신용위험 간에 중요한 재무 변수는 서로 다르게 나타남을 알 수 있었다. 이 는 고 신용위험(high credit-risk) 기업에 대한 새로운 평가 기준의 필요성을 시사한다. 또 한, 신용 등급 전이를 시각화한 결과, 고 신용위험으로 전이된 기업은 이후에 회복되기 어 려운 현상을 확인할 수 있었다. 이러한 연구결과는 머신러닝 기반 신용평가 모형의 개선 가능성을 제시하고, 금융 기관들이 신용위험 관리를 더욱 효율적으로 수행할 수 있는 기초 자료를 제공한다.
목차
Abstract
1. 서론
2. 데이터 탐색
2.1 전체 산업 데이터
2.2 제조업 데이터
3. 신용위험 모형과 머신러닝방법의 적용
3.1. 모형의 설정
3.2. 머신러닝 방법의 적용
4. 특성변수의 중요도 비교결과
4.1. 특성변수의 중요도 비교
4.2. SHAP
5. 신용등급 변화
6. 결론
참고문헌
7. Appendix