원문정보
Research of Data Partitioning Based User Repertoires for Parallel Collaborative Filtering
초록
영어
Collaborative filtering is a representative technique of recommendation systems. Collaborative filtering is a method of determining a recommendation target based on similarity between users or items. Distributed parallel collaborative filtering was proposed to improve the computational speed of collaborative filtering. However, the data skewness problem caused by imbalanced data distribution still remains. Therefore, in this study, we proposed a data distribution and processing method based on the user taste repertoire analysis method to solve the data skewness problem caused by data distribution imbalance. So, the repertoire analysis is to analyze the range and number of areas of the services previously used by the users. In the proposed method, data is distributed based on the results of the repertoire analysis of the services previously used by the users. Our experiment distributing data of users based on the results of the repertoire analysis. It was shown that the performance was sufficiently usable as measuring RMSE and execution time.
한국어
협업 필터링은 추천 시스템의 대표적인 기술로, 사용자 또는 항목 간의 유사성을 기반으로 추천 대상을 결정하는 방 법이다. 협업 필터링의 계산 속도를 높이기 위해 분산 병렬 협업 필터링이 제안되었다. 그러나 데이터 분산 불균형 으로 인한 데이터 왜곡 문제는 여전히 남아 있다. 따라서 본 연구에서는 데이터 분포 불균형으로 인한 데이터 왜곡 문제를 해결하기 위해 사용자 취향 레퍼토리 분석 방법에 기반한 데이터 분포 및 처리 방법을 제안하였다. 레퍼토 리 분석은 사용자가 이전에 사용했던 서비스 영역의 범위와 수를 분석하는 것이며, 제안된 기법에서는 사용자가 이 전에 사용했던 서비스에 대한 레퍼토리 분석 결과를 기반으로 데이터를 배포한다. 레퍼토리 분석 결과를 기반으로 사용자 데이터를 배포하는 실험이다. 성능은 RMSE 및 실행 시간 측정으로 충분히 사용할 수 있음을 보였다.
목차
Abstract
1. 서론
2. 배경지식
2.1. 협업 필터링(CF)
2.2. 레퍼토리(repertoire)
3. 관련 연구
4. 레퍼토리 기반 협업 필터링
4.1. 제안 기법의 개관
4.2. CRT를 적용한 레퍼토리 크기 기반 그룹화
4.3. CRT를 적용한 레퍼토리 종류 기반 그룹화
5. 성능 평가
5.1. 실험 환경
5.2. 레퍼토리 크기 기반 CF
5.3. 레퍼토리 종류 기반 CF
6. 결론
참고문헌