earticle

논문검색

기술

다차원 데이터 평가가 가능한 개선된 FSDD 연구

원문정보

An Improvement of FSDD for Evaluating Multi-Dimensional Data

오세종

피인용수 : 0(자료제공 : 네이버학술정보)

초록

영어

Feature selection or variable selection is a data mining scheme for selecting highly relevant features with target concept from high dimensional data. It decreases dimensionality of data, and makes it easy to analyze clusters or classification. A feature selection scheme requires an evaluation function. Most of current evaluation functions are based on statistics or information theory, and they can evaluate only for single feature (one-dimensional data). However, features have interactions between them, and require evaluation function for multi-dimensional data for efficient feature selection. In this study, we propose modification of FSDD evaluation function for utilizing evaluation of multiple features using extended distance function. Original FSDD is just possible for single feature evaluation. Proposed approach may be expected to be applied on other single feature evaluation method.

한국어

피처선택, 혹은 변수 선택은 피처의 수가 매우 많은 고차원 데이터에서 주어진 주제와 연관성이 높은 피처 를 선별하는 과정으로서, 데이터의 차원수를 낮추어 군집분석이나 분류 분석 등을 용이하게 하는데 중요한 기법이다. 많은 수의 피처들 중에서 일부의 피처를 선별하기 위해서는 피처들을 평가하기 위한 도구가 필요하다. 현재까지 제 안된 도구들은 대부분 확률이론이나 정보이론에 기초하여 만들어졌기 때문에 하나의 피처, 즉 1차원 데이터만을 평 가할 수 있다. 그러나 피처들 간에는 상호작용이 있기 때문에 하나의 피처를 평가하기 보다는 여러 피처들의 집합, 즉 다차원 데이터를 평가할 수 있어야 효과적인 피처 선택이 가능하다. 본 연구에서는 확장된 거리 함수를 이용하여 1차원 데이터 평가용으로 제안된 FSDD 평가 함수를 다차원 데이터에 대한 평가가 가능하도록 개선하는 방법에 대 해 제안하였다. 본 연구에서 제안한 접근법은 다른 1차원 데이터 평가함수에도 적용이 될 수 있을 것으로 기대된다.

목차

요약
 Abstract
 1. 서론
 2. 관련연구
 3. mFSDD의 구현
 4. mFSDD 의 적용사례
 5. 결론
 ACKNOWLEDGMENTS
 REFERENCES

저자정보

  • 오세종 Se-jong Oh. 단국대학교 공과대학 소프트웨어학과

참고문헌

자료제공 : 네이버학술정보

    함께 이용한 논문

      ※ 기관로그인 시 무료 이용이 가능합니다.

      • 4,000원

      0개의 논문이 장바구니에 담겼습니다.