earticle

논문검색

경영

Exploring the Performance of Synthetic Minority Over-sampling Technique (SMOTE) to Predict Good Borrowers in P2P Lending

원문정보

P2P 대부 우수 대출자 예측을 위한 합성 소수집단 오버샘플링 기법 성과에 관한 탐색적 연구

Francis Joseph Costello, Kun Chang Lee

피인용수 : 0(자료제공 : 네이버학술정보)

초록

영어

This study aims to identify good borrowers within the context of P2P lending. P2P lending is a growing platform that allows individuals to lend and borrow money from each other. Inherent in any loans is credit risk of borrowers and needs to be considered before any lending. Specifically in the context of P2P lending, traditional models fall short and thus this study aimed to rectify this as well as explore the problem of class imbalances seen within credit risk data sets. This study implemented an over-sampling technique known as Synthetic Minority Over-sampling Technique (SMOTE). To test our approach, we implemented five benchmarking classifiers such as support vector machines, logistic regression, k-nearest neighbor, random forest, and deep neural network. The data sample used was retrieved from the publicly available LendingClub dataset. The proposed SMOTE revealed significantly improved results in comparison with the benchmarking classifiers. These results should help actors engaged within P2P lending to make better informed decisions when selecting potential borrowers eliminating the higher risks present in P2P lending.

한국어

본 연구는 P2P 대부 플랫폼에서 우수 대출자를 예측시 유용한 합성 소수집단 오버샘플링 기법을 제안하고 그 성과를 실증적으로 검증하고자 한다. P2P 대부 관련 우수 대출자를 추정할 때 일어나는 문제점중의 하나는 클래스 간 불균형이 심하여 이를 해결하지 않고서는 우수 대출자 예측이 쉽지 않다는 점이다. 이러한 문제를 해결하기 위하여 본 연구에서는 SMOTE, 즉 합성 소수집단 오버샘플링 기법을 제안하고 LendingClub 데이터셋에 적용하여 성과를 검증하였다. 검증결과 SMOTE 방법은 서포트 벡터머신, k-최근접이웃, 로지스틱 회귀, 랜덤 포레스트, 그리고 딥 뉴럴 네트워크 분류기와 비교하여 통계적으로 우수한 성과를 보였다.

목차

Abstract
요약
1. Introduction
2. Related Work
2.1 Machine learning and credit risk assessment
2.2 Class imbalances and SMOTE
2.3 Classifying Models
3. Methodology
3.1 LendingClub dataset
3.2 Pre-processing
3.3 Cost sensitive analysis
3.4 Model description
4. Results
4.1 Cost-sensitive analysis
4.2 Empirical results
5. Conclusion
REFERENCES

저자정보

  • Francis Joseph Costello PhD Student, SKK Business School, Sungkyunkwan University
  • Kun Chang Lee 이건창. Professor, Global Business Administration/Dept of Health Sciences & Technology, SAIHST Sungkyunkwan University

참고문헌

자료제공 : 네이버학술정보

    함께 이용한 논문

      ※ 기관로그인 시 무료 이용이 가능합니다.

      • 4,000원

      0개의 논문이 장바구니에 담겼습니다.