원문정보
초록
한국어
빅데이터에 대한 관심 증가와 함께 온라인상에서 다수의 참여자가 작성하는 텍스트 데이터를 수집 및 분석하여 의견 정보를 추출하고자 하는 감성분석(sentiment analysis) 방안 연구들이 활발히 이루어지고 있다. 온라인상에서 발생하는 여론의 감성분석 방안 중 하나로는 분석 대상 문장에서 출현하는 용어들과 구축된 감성사전 용어들과의 비교를 통하여 문장의 극성을 긍정·부정으로 판별하는 방안이 존재한 다. 이때, 분석 대상 문장의 극성은 감성사전의 긍정·부정 용어와 대응되는 용어들의 출현 빈도에 따라 결정되므로, 감성사전 구축은 문장의 감성분석 성능을 결정짓는 중요한 요소 중 하나이다. 감성사전을 활용한 감성분석 시 고려해야 할 주요 사항은 특정 주제의 상황이나 목적에 따른 어휘의 의미 변화를 고려해야 한다는 점이다. 특히 온라인에서 게시되는 다양한 의견들은 신조어를 사용하거 나, 특정 주제나 이슈에 따라 사용하는 어휘의 감성 또한 일반적인 의미와는 다르게 사용 될 수 있 다. 이를 고려하여, 본 연구에서는 소셜 미디어 상에서 발생되는 사회적 여론의 효과적인 분석을 위하여 특정 주제나 이슈 변화에 따른 감성사전 확장 방안을 제시하고자 한다. 감성사전 확장을 위한 기존 감성사전과 신규 용어간의 유사성 분석은 단어 간 동시출현 확률 값을 도출하는 SO-PMI (Semantic Orientation from Pointwise Mutual Information)을 활용하 며, 최종적으로 감성분류 정확도 비교 실험을 통하여 연구 방안의 유용성을 검증하고자 한다.
목차
1. 서론
2. 감성사전 확장 방안
2.1 분석 데이터Document Format
3.2 SO-PMI (Semantic Orientation from Point-wise Mutual Information)
3. 분석 결과
4. 결론
References