earticle

논문검색

Doc2Vec을 이용한 불일치 리뷰의 조정된 평점을 이용한 추천 시스템의 성능 향상 분석

원문정보

Analysis of Performance Improvement of Recommender Systems Using Adjusted Ratings of Inconsistent Reviews Using Doc2Vec

고건우, 김재경

피인용수 : 0(자료제공 : 네이버학술정보)

초록

한국어

추천 시스템의 성능을 향상시키기 위하여는 가능한 정확한 사용자 정보를 활용할 필요가 있다. 사용자가 남긴 제품 혹은 서비스 평점은 편리하다는 장점은 있으나, 사용자의 선호를 정확하게 표현하지 못하는 한계가 존재하기 때문에 평점만을 사용한 전통적인 방법의 추천 시스템은 성능의 한계가 존재한다. 따라서 사용자의 선호를 자세하게 파악하기 위해선 평점보다 더욱 자세한 선호가 담긴 리뷰 텍스트를 활용할 수 있다. 하지만 리뷰 텍스트와 평점을 동시에 활용할 경우, 평점은 긍정적인 평점을 남겼지만 리뷰 텍스트에는 부정적인 내용이 담긴 불일치가 존재하는 경우가 있다. 이러한 불일치는 추천시스템의 성능을 저하시킨다고 알려져 있다. 따라서 본 연구는 사용자 리뷰 중 텍스트 리뷰와 평점 간에 차이가 있는 불일치 리뷰를 식별하고 식별된 불일치 리뷰에 기반한 조정된 평점을 이용하여 추천 시스템의 성능을 향상시키고자 한다. 이를 위해 TripAdvisor의 미국 9개 도시(애너하임, 애틀랜타, 시카고, 라스베이거스, 로스앤젤레스, 뉴욕, 올랜도, 필라델피아, 워싱턴)의 2002년부터 2021년까지 1,987개 호텔에 남긴 총 41,810명 고객의 리뷰 데이터 301,346개를 사용하였다. 평점과 리뷰 텍스트의 불일치 리뷰를 식별하기 위해 5개의 Lexicon기반 감성 모델인 Vader, TextBlob, Afinn, Stanza, Bing을 활용한다. 기존 연구에 따라서 사용자 평점과 5개의 모델 중 불일치가 1개라도 있는 경우를 불일치 리뷰로 분류하였다. 불일치 리뷰는 전체 리뷰의 20.99%로 나타났으며 Doc2vec 모델을 활용하여 가장 유사한 리뷰의 평점을 통해 조정된 평점을 부여하였다. Matrix Factorization을 활용하여 기존 평점을 사용한 Original Group, 조정된 평점을 사용한 Adjusted Group, 불일치 리뷰를 제거한 Consistent Group의 추천 시스템 성능을 비교하였다. 그 결과 Adjusted Group의 RMSE는 0.4326으로 Original Group의 RMSE인 0.5218보다 개선된 것을 확인하였다. 또한 벤치마크 시스템인 Consistent Group의 RMSE인 0.3869와 큰 차이를 보이지 않았다. 이는 기존 추천 시스템보다 불일치 리뷰에 대해 조정된 평점을 사용하였을 경우 추천 시스템의 성능이 향상되었음을 의미한다. 또한 불일치 리뷰를 제거한 벤치마크 시스템과 유사한 성능을 통해 제거 없이 모든 사용자에 대해 우수한 추천 시스템이 구축되었음을 알 수 있다.

저자정보

  • 고건우 경희대학교 빅데이터응용학과
  • 김재경 경희대학교 경영대학 & 빅데이터응용학과

참고문헌

자료제공 : 네이버학술정보

    함께 이용한 논문

      0개의 논문이 장바구니에 담겼습니다.