earticle

논문검색

Session H - 일반세션 : Big Data, 좌장 : 김병수(영남대학교)

텍스트 마이닝을 이용한 빅 데이터의 신뢰도 검증에 대한 연구

초록

한국어

최근 실시간으로 생성되는 빅 데이터로부터 유의미한 정보를 발굴할 수 있는 다양한 방법들이 소개되면서 폭넓은 경영 의사결정 분야에 적용되고 있다. 그러나 이런 데이터 분석으로부터 얻어진 결과에 대한 실증적인 검증에 대한 시도는 아직 미비한 상황이다. 특히 정량적인 데이터가 아닌 정성적인 데이터 분석에 대한 검증 시도는 더욱더 전무한 상태이다. 과거 정성적인 데이터를 이용한 대표 의사결정 지원 시스템인 전문가 시스템에서도 데이터 검증에 대한 이슈가 크게 대두된 것을 미루어 본다면, 현재 소셜 사이트에 게재된 다양한 의견을 텍스트 마이닝 기법을 이용하여 분석하여, 실제 대중의 의견을 가름하고자 하는 시도에 대한 검증 또한 이루어져야 할 시기라고 생각된다. 그러나 소셜 사이트에 게재된 의견들이 실제 사람들의 의견을 대변하는지에 대한 실증적인 조사는 이루어지지 못하고 있다. 본 연구에서는 국내의 포털 사이트에서 운영하는 블로그로부터 특정 주제와 연관된 대량의 텍스트 데이터와 실제 설문지를 통해 수집된 텍스트 데이터를 동일한 텍스트 마이닝 기법을 이용하여 분석 후, 두 개의 서로 다른 텍스트 데이터로부터 추출된 중요 키워드들을 비교, 분석하였다. 주요 키워드를 분석하기 위한 방법으로 키워드-문서 간 TF-ID 가중치 값을 활용하여 키워드-키워드 간 매트릭스를 구축 하였으며, 매트릭스 간의 상관관계 값을 Mantel test 기법을 이용하여 분석 하였다. 분석을 통해 블로그에 게시된 소셜 데이터의 키워드 매트릭스와 뉴스 데이터의 키워드 매트릭스는 통계적으로 유의한 상관관계를 보이는 것으로 나타났다. 본 연구는 국내 소셜 데이터의 신뢰도를 측정하는 방법론에 있어서 실질적인 기초적 자료를 제공했다는데 의의가 있으며, 많은 연구에 활용되는 소셜 데이터의 신뢰도에 대한 근본적인 연구의 필요성을 제시했다는데 의의가 있다.

목차

초록
 1. 서론
 2. 기존 문헌
 3. 연구 설계
  3.1 연구 문제
  3.2 연구 모형
  3.3 연구 방법
 4. 연구 결과
  4.1 기술 통계
  4.2 TF-IDF 가중치 매트릭스
  4.3. Mantel test
  4.4. 추가 분석
 5. 결론 및 시사점
 6. 결론 및 시사점
 7. 논문 사사

저자정보

  • 박승리 한양대학교 일반대학원 비즈니스인포매틱스학과 석사
  • 김진화 서강대학교 경영대학 교수
  • 백승익 한양대학교 경영대학 교수

참고문헌

자료제공 : 네이버학술정보

    함께 이용한 논문

      ※ 기관로그인 시 무료 이용이 가능합니다.

      • 4,000원

      0개의 논문이 장바구니에 담겼습니다.