earticle

논문검색

분류 성능 향상을 위한 비감독학습 기반의 패턴 선택

원문정보

Pattern Selection based on Unsupervised Learning for Improving the Performance of Classification

김만선, 주복규

피인용수 : 0(자료제공 : 네이버학술정보)

초록

영어

Pattern selection algorithms are to select some useful patterns from all learning patterns and use them as training patters. Useful pattern is a pattern that contributes much to the learning. For classification problems, useful patters are those near class boundary or class center. Noise patterns will decrease the performance of classification model. In this paper, we propose a pre-processing technique to eliminate those noise patterns. This is based on un-supervised learning technique, which is different from traditional sampling techniques. We will have several benefits when model is learned from useful patterns only: decrease in both computation time and space requirements while learning as well as the decrease of class imbalance. To show the effectiveness of proposed techniques, we applied it to one synthetic data set and two real-world benchmark data sets. For the breast cancer case, we achieved the increase of all of precision, recall, and F1 values even if data set is reduced to less than 50%.

한국어

패턴 선택은 주어진 전체 학습 패턴으로부터 일부 유용한 패턴들을 추출하여 학습에 이용하는 방법이다. 분류 문제에서 유용한 학습패턴은 클래스들 간의 분류경계에 근접하거나 클래스의 중심 부근에 속한 패턴을 정상패턴이라고 한다. 이러한 패턴 중에서 노이즈 패턴이 포함된다면 분류 모델의 성능을 저하시킨다. 제안하는 방법은 노이즈를 제거하는 일종의 전처리 작업으로서 기존의 샘플링 방법을 사용하지 않고, 비감독 학습을 도입하여 노이즈 데이터를 제거한다. 그 결과 선택된 데이터로 학습할 경우, 학습 데이터 수 감소로 인한 계산 시간 단축 및 메모리 공간 절약의 효과 그리고 클래스 불균형 문제에서 불균형 비율을 감소시키는 효과가 있다. 제안하는 방법의 효율성을 알아보기 위하여 인공 데이터와 실제 문제에 적용하였다. 적용 결과 breast cancer 데이터는 전체 데이터수의 54%를 제거하였어도 정확률, 재현율, F1 값이 모두 향상되었다.

목차

요약
 Abstract
 Ⅰ. 서론
 Ⅱ. 관련 연구
  1. 데이터의 분포와 속성에 의한 방법
  2. 샘플링에 의한 방법
 Ⅲ. SOM 기반의 개선된 샘플링 기법
  1. 패턴 점수 기반의 새로운 훈련 집합 획득
 Ⅳ. 실험 및 결과
  1. 인공 데이터 실험
  2. 실제 데이터 실험
 Ⅴ. 결론
 참고문헌

저자정보

  • 김만선 Man-Sun Kim. 정회원, 전남대학교 전산학과
  • 주복규 Bok-Gyu Joo. 종신회원, 홍익대학교 정보통신공학과

참고문헌

자료제공 : 네이버학술정보

    함께 이용한 논문

      ※ 원문제공기관과의 협약기간이 종료되어 열람이 제한될 수 있습니다.

      0개의 논문이 장바구니에 담겼습니다.