원문정보
Variable Selection by Association in Data mining
초록
영어
This paper introduces a noble method of variable selection utilizing interaction effects between variables to enhance performances of classification/prediction models in data mining. The proposed method utilizes the association of data mining and finds variables which affect the target variable in some way. Those new variables are further screened, multplied to form interaction effect, and finally input to the model. As a result, the model added with the new variables performed better than compared models.
한국어
본 논문에서는 데이터마이닝에서 분류·예측 모형의 성과를 높이기 위하여 기존의 변수들의 상호작용효과를 고려한 새로운 변수를 추가는 방법에 대하여 기술한다. 이를 위하여 연관분석을 통하여 종속변수의 값을 성공으로 만드는 데에 유사한 행위를 하는 변수들을 골라내고, 그 변수들의 값을 곱으로 하는 새로운 변수를 추가하여 모형을 구축해 보았다. 주식시장의 이상매매데이터에 적용한 결과, 새로운 모형은 기존의 모형과 비교하여 나은 성과를 나타내었다.
목차
Abstract
1. 서론
2. 연관분석을 사용한 변수의 추출및 모형의 구축
2.1 주식시장 데이터
2.2 변수의 선정
2.3 연관분석의 적용
2.4 연관규칙을 이용한 의사결정나무
2.5 연관규칙을 이용한 로지스틱 회귀
2.6 연관규칙을 사용하지 않은 모형과의 비교
3. 결론 및 시사점
참고문헌
