earticle

논문검색

협업 필터링 추천에서 대응평균 알고리즘의 예측 성능에 관한 연구

원문정보

A study on the Prediction Performance of the Correspondence Mean Algorithm in Collaborative Filtering Recommendation

이석준, 이희춘

피인용수 : 0(자료제공 : 네이버학술정보)

초록

영어

The purpose of this study is to evaluate the performance of collaborative filtering recommender algorithms for better prediction accuracy of the customer's preference. The accuracy of customer's preference prediction is compared through the MAE of neighborhood based collaborative filtering algorithm and correspondence mean algorithm. It is analyzed by using MovieLens 1 Million dataset in order to experiment with the prediction accuracy of the algorithms. For similarity, weight used in both algorithms, commonly, Pearson's correlation coefficient and vector similarity which are used generally were utilized, and as a result of analysis, we show that the accuracy of the customer's preference prediction of correspondence mean algorithm is superior. Pearson's correlation coefficient and vector similarity used in two algorithms are calculated using the preference rating of two customers' co-rated movies, and it shows that similarity weight is overestimated, where the number of co-rated movies is small. Therefore, it is intended to increase the accuracy of customer's preference prediction through expanding the number of the existing co-rated movies.

한국어

본 연구의 목적은 좀 더 정확한 고객 선호도 예측을 위한 협업 필터링 알고리즘의 예측 성능을 평가하기 위한 것이다. 고객 선호도 예측의 정확도를 비교하기 위하여 이웃 기반의 협업 필터링 알고리즘과 대응평균 알고리즘에 의한 고객 선호도 예측의 MAE를 비교하였다. 예측 알고리즘의 정확성을 분석하기 위하여 MovieLens 1 Million dataset을 이용하여 실험을 하였다. 각 예측 알고리즘에 사용된 유사도 가중치는 일반적으로 이용되는 피어슨 상관계수와 벡터 유사도를 이용하였으며 분석결과 대응평균 알고리즘의 예측 정확도가 이웃 기반의 협업 필터링 알고리즘의 예측 정확도 보다 우수한 것으로 나타났다. 두 알고리즘에 사용된 유사도 가중치인 피어슨 상관계수와 벡터 유사도는 두 고객이 특정 상품에 대하여 공통으로 평가한 선호도 평가치를 이용하여 계산된다. 이때 공통으로 평가한 선호도 평가치의 개수가 적으면 계산된 유사도 가중치가 과대 평가된다. 과대 평가된 유사도 가중치를 보정하여 고객 선호도 예측의 정확도를 높이기 위하여 기존의 연구에서 고려한 공통 평가 영화의 개수 보다 확대된 범위를 적용하였으며 각 예측 방법에 따라 서로 다른 개선 경향을 파악할 수 있었다.

목차

요약
 I. 서론
 II. 이론적 배경
  2.1 추천시스템의 개념
  2.2 추천시스템의 분류
  2.3 협업 필터링(Collaborative filtering)
 III. 추천 알고리즘
  3.1 이웃 기반의 협업 필터링 알고리즘(Neighborhood-Based Collaborative Filtering Algorithm)
  3.2 유사도 가중치(similarity weight)
  3.3 대응평균 알고리즘(Correspondence Mean Algorithm)
  3.4 선호도 예측 정확도 평가척도
  3.5 공통 선호도 평가 쌍(co-ratings)의 영향
 IV. 실험설계 및 분석
  4.1 실험 dataset의 구성
  4.2 실험 방법
  4.3 분석 결과
 V. 결론
 참고문헌
 Abstract

저자정보

  • 이석준 Seok Jun Lee. 상지대학교 경영학과 겸임교수
  • 이희춘 Hee Choon Lee. 상지대학교 컴퓨터데이터정보학과 교수

참고문헌

자료제공 : 네이버학술정보

    함께 이용한 논문

      ※ 기관로그인 시 무료 이용이 가능합니다.

      • 5,400원

      0개의 논문이 장바구니에 담겼습니다.