earticle

논문검색

나이브 베이지안을 사용한 성명에 대한 성별 구분 연구

원문정보

A Study on Sex Classification of a Name using Naive Bayesian

임명재, 정진표, 김명관

피인용수 : 0(자료제공 : 네이버학술정보)

초록

영어

This article employs Naive Bayesian Classifier to realize a system that can distinguish the sex of a name. Unlike foreign names, in Korean names, the pronoun referring to a person shows discordance with sex. With the characteristics of Korean names, however, the study distinguishes names frequently used for men and for women. And as it also includes names of which sex is rather ambiguous such as proper nouns, the accuracy of it is somewhat low. The result of the experiment conducted in this article indicates 84% accuracy for Korean men and 88% for Korean women; thus, the total accuracy equals 86%. Meanwhile, about foreign names, men show 80% accuracy, and women 84%, so the total accuracy equals 83%.

한국어

본 논문은 Naive Bayesian분류기를 사용하여 성명의 성별을 구분하는 시스템을 구현 하였다. 국내인 성명은 외국인 성명과는 다르게 사람을 지칭할 때 쓰는 대명사의 성별불일치 현상이 있다. 하지만 국내인 성명의 특성으로 남자로 자주 쓰이는 이름과 여자로 자주쓰이는 이름을 구분하게 하였다. 그리고 고유명사등, 성별이 애매한 이름들도 포함하였기 때문에 다소 정확율이 떨어지는 것을 확인 할 수가 있었다. 본 논문의 실험 결과로는 국내인 남자는 84%, 여자는 88%의 정확율을 보였으며, 총합 86%의 정확율과 외국인 성명은 남자는 80%, 여자는 84%로 총합 83% 의 정확율을 보이고 있다.

목차

요약
 Abstract
 Ⅰ. 서론
 Ⅱ. 성명 인식에 대한 기존 연구
 Ⅲ. 성명의 특성
 Ⅳ. 성명에 대한 성별 구분
 Ⅴ. 실험 및 분석
 Ⅵ. 결론 및 향후 연구
 References

저자정보

  • 임명재 Myung-Jae Lim. 종신회원, 을지대학교 의료IT마케팅학과
  • 정진표 Jin-Pyo Jung. 준회원, 을지대학교 의료IT마케팅학과
  • 김명관 Myung-Gwan Kim. 정회원, 을지대학교 의료IT마케팅학과

참고문헌

자료제공 : 네이버학술정보

    함께 이용한 논문

      ※ 기관로그인 시 무료 이용이 가능합니다.
      ※ 학술발표대회집, 워크숍 자료집 중 4페이지 이내 논문은 '요약'만 제공되는 경우가 있으니, 구매 전에 간행물명, 페이지 수 확인 부탁 드립니다.

      • 4,000원

      0개의 논문이 장바구니에 담겼습니다.