earticle

논문검색

논문

웹 페이지 컨텐츠 점수를 이용한 개선된 페이지랭크 알고리즘

원문정보

An Extended Page Rank Algorithm using Web Page Contents Score

김태원, 나연묵

피인용수 : 0(자료제공 : 네이버학술정보)

초록

영어

Recently, the Web developed as the media which offers and sharers more information thanks to the rapid progress in web technology. Consequently, a lot of methods are being studied in order to improve the quality of search in web searches. Of these, as the core algorithm of Google search engine, Page Rank algorithm is known to effectively rank. However, existing page rank algorithm is performing using only the number of links. This paper suggests the efficient algorithm that reflects not only the number of links but also the contents score of web page. To achieve this ,the paper introduces the scoring technique of contents in web page and proposes two improved algorithm that has an effect on the score of links. It shows that, proposed algorithm more effectively reflects the contents score of web page than established page rank algorithm through a comparative experimental study on each algorithm.

한국어

최근 웹 검색 분야에서 검색의 질을 높이기 위한 기법들이 많이 연구되고 있다. 페이지랭크 알고리즘은 구글 검색엔진의 핵심 알고리즘으로써 웹 문서들을 효과적으로 랭킹하는 것으로 알려져 있다. 그러나 기존의 페이지랭크 알고리즘은 링크의 수만을 이용하여 랭킹을 수행하고 있다. 본 논문에서는 단순히 링크의 수뿐만 아니라 웹 페이지의 컨텐츠에 대한 점수를 랭킹에 반영하는 효율적인 알고리즘을 제시한다. 이를 위하여 웹 페이지의 컨텐츠를 점수화하는 기법을 소개하고 링크의 점수에 영향을 주는 2가지의 개선된 알고리즘을 제시한다. 비교 실험을 통해 제안 알고리즘이 기존의 페이지랭크 알고리즘 보다 웹 페이지의 컨텐츠의 점수를 효율적으로 반영함을 보인다.

목차

요약
 Abstract
 1. 서론
 2. 관련연구
 3. 웹 페이지의 본문 컨텐츠를 점수화하는 방법
  3.1 웹 페이지 본문 컨텐츠 점수 도입 배경
  3.2 본문 컨텐츠를 점수화하는 방법
  3.3 표준오차의 도입과 스케일 변환
 4. 개선알고리즘
  4.1 PR-S: 웹 페이지의 점수를 반영하는 링크의점수로 개선된 알고리즘
  4.2 PR-WS: 분산되는 링크에 점수에 따른 차별방식으로 개선된 알고리즘
 5. 실험
  5.1 실험설정
  5.2 가상의 데이터에 대한 기존 알고리즘 실험결과
  5.3 개선된 알고리즘 적용된 실험
  5.4 보다 복잡한 가상데이터의 실험
 5. 결론 및 향후 연구 계획
 참고문헌

저자정보

  • 김태원 Taewon Kim. 단국대학교 컴퓨터학부
  • 나연묵 Younmook Nah. 단국대학교 컴퓨터학부

참고문헌

자료제공 : 네이버학술정보

    함께 이용한 논문

      0개의 논문이 장바구니에 담겼습니다.