원문정보
SNS Comments Filtering and Classification Using K-Means Clustering
초록
영어
Recently, according to the rapid change of the supply rate of smartphones, comments on the webblogs are increased. It is difficult to manually search the needful comments among enormous comments. To solve the problem, we present an automatic classification system on the comments. Since it needs the definition of the topics to classify, we apply the learning method with clustering to the definition. This research enables the study on comments filtering, automatic learning, and comments classification techniques.
한국어
최근 스마트폰의 보급률이 늘어나고 쉽게 블로그에 접속하여 댓글을 달 수 있게 됨에 따라 댓글의 양이 기하급수적으로 늘어나고 있다. 수많은 댓글에서 필요로 하는 정보를 수작업으로 찾기에는 어려움이 있다. 본 연구는 이를 해소하기 위해 댓글을 자동으로 분류하는 연구를 하였다. 또한 댓글을 분류하기 위해 댓글의 분류 주제를 정할 필요가 있다. 본 연구에서는 클러스터링 기법을 통해 댓글의 분류 주제를 자동으로 정의하고자 하였다. 본 연구를 통해 댓글 처리 기법과 자동학습 알고리즘, 댓글 분류 방법에 대한 기술을 학습하여 문서 분류 등의 정보기술 분야의 지식을 축적할 수 있다.
목차
I. 연구의 필요성 및 목적
II. 이론적 배경
1. 댓글 처리
2. 유클리디안 거리
3. 클러스터링(Clustering)
III. 연구 방법
1. 클러스터링을 이용한 분류 시스템 개요
2. 분류 영역
3. 벡터변환기
IV. 연구 결과
1. 실험 순서
2. 실험 및 결과
V. 결론 및 제언
참고문헌
국문초록