earticle

논문검색

<연구논문>

표형식 데이터 기반 Transformer 방법론을 활용한 개인 신용대출 부도예측 모형

원문정보

Personal Credit Loan Default Prediction Model Using the Transformer Methodology Based on Tabular Data

김창효, 이군희

피인용수 : 0(자료제공 : 네이버학술정보)

초록

영어

Since COVID-19, the rise in prices and the increase in the base interest rate in major countries to suppress it have affected the global financial market, and the delinquency rate of personal credit loans is also increasing in Korea. In this situation, the ability to accurately predict the possibility of personal credit loan default is becoming important, and this study aims to predict default using standardized credit information data. Various approaches have been attempted in personal credit loan default prediction research, from statistical methods to machine learning, and recently, deep learning methods such as multilayer perceptron have been applied. However, multilayer perceptron does not reflect contextual information between input variables, so it does not show improvement in prediction performance compared to existing machine learning methods. In this study, in order to overcome the shortcomings of the existing multilayer perceptron methodology, the Transformer methodology, which is mainly used in the natural language processing field, was applied to the problem of personal credit loan default prediction, and as a result, it was confirmed that it showed an improvement in prediction performance compared to the existing deep learning and showed the same level of prediction performance as the XGBoost methodology, an ensemble-based decision tree with the best prediction performance among previous methods. The implication of this study is that the Transformer methodology, which is mainly used in natural language processing, can be effective in the problem of predicting personal credit loan defaults using tabular data consisting of various variables. This suggests that, compared to existing traditional modeling techniques, Transformer can better capture complex interactions between high-dimensional data and improve prediction performance. This shows that the Transformer model has the potential to expand its application range in various prediction problems in the financial field.

한국어

코로나19 이후 물가 상승과 이를 억제하기 위한 주요 국가들의 기준금리 인상이 글로벌 금융시장에 영향을 미치며, 한국에서도 개인 신용대 출 연체율이 상승하고 있다. 이러한 상황에서 개인 신용대출 부도 가능성을 정확하게 예측하는 능력이 중요해지고 있으며, 본 연구는 정형화된 신용정보 데이터를 활용해 부도 여부를 예측하고자 한다. 개인 신용대출 부도예측 연구에서는 통계적 방법론부터 기계학습까지 다양한 접근 이 시도되었으며, 최근에는 다층퍼셉트론과 같은 심화학습 방법론도 적용되고 있다. 그러나 다층퍼셉트론은 입력변수 간의 맥락 정보를 반영 하지 못해, 기존 기계학습 방법론보다 예측 성능에서 개선을 보이지 못하고 있다. 본 연구에서는 기존 다층퍼셉트론 방법론의 단점을 극복하기 위해, 자연어처리 영역에서 주로 활용되고 있는 Transformer 방법론을 개인 신용대출 부도예측 문제에 적용해 보았고, 그 결과 기존 심화학습 대비 예측 성능의 개선과 함께 이전의 방법론 중 예측성능이 가장 뛰어난 앙 상블 기반 의사결정나무인 XGBoost 방법론과 동등한 수준의 예측성능을 보이고 있음을 확인하였다. 본 연구의 시사점은 자연어처리에 주로 사용되던 Transformer 방법론이, 다양한 변수로 구성된 표형식 데이터를 활용한 개인 신용대출 부도예측 문제에서도 효과적일 수 있음을 확인 했다는 점이다. 이는 기존의 전통적인 모델링 기법들과 비교하여 Transformer가 고차원 데이터 간의 복잡한 상호작용을 더 잘 포착하고, 예측 성능을 향상시킬 수 있음을 시사한다. 이로써 Transformer 모델은 금융 분야의 다양한 예측 문제에서 그 활용 범위를 확장할 수 있는 가능성을 보여주고 있다.

목차

요약
I. 서론
II. 선행연구 및 방법론
1. 선행 연구
2. 선행 연구 방법론
III. 연구 방법론
1. Transformer
2. Tab-Transformer
3. FT-Transformer
IV. 분석 및 결과
1. 분석 데이터
2. 학습 방법
3. 결과 분석
V. 결론
참고문헌
APPENDIX: Lending Club 데이터 분포
Abstract

저자정보

  • 김창효 Kim, Chang-Hyo. 서강대학교 일반대학원 경영학과
  • 이군희 Lee, Gun-Hee. 서강대학교 경영학과 교수

참고문헌

자료제공 : 네이버학술정보

    함께 이용한 논문

      ※ 기관로그인 시 무료 이용이 가능합니다.

      • 4,300원

      0개의 논문이 장바구니에 담겼습니다.