원문정보
Dynamic document Integration using unstructured web documents based on customer’s preferences
초록
한국어
본 연구에서는 웹 문서들로부터 추출된 정보들을 이용하여 사용자가 필요로 하는 정보를 통합 생성 할 수 있는 프레임워크 i-Reader를 제안한다. 본 프레임워크에서는 RSS (Really Simple Syndication)를 통해 관심 있는 웹 문서를 전달받는 것으로 가정하여 추출 가능한 정보의 대상 범위를 제한함과 동시에 정보 검색의 어려움도 완화하였다. i-Reader는 WDDM(Web Document Decomposition Module, IIM(Information Identification Module 및 IIGM(Information Integration and Generation Module)으로 구성된다. WDDM에서는 전달받은 웹 문서가 포함하고 있는 정보를 주제어에 따라 정제하고 사례 및 Fact들을 정의한다. 사례들은 Fact들로 구성되며, Facts는 Feature와 Value로 구성된다. IIM에서는 사용자의 요구를 만족하는 정확한 정보 추출을 위해 수직적 유사도 (Vertical similarity)와 수평적 유사도 (Horizontal similarity)를 이용하여 정보를 추출한다. 수직적 유사도(Vertical similarity)는 사용자 요구사항에 따른 유사 사례(Case)들을 추출하기 위한 것이며, 수평적 유사도(Horizontal similarity)는 사례 보정을 위해 필요로 하는 Facts들을 추출하기 위한 것이다. IIGM에서는 사용자요구사항, 추출된 사례 및 Facts정보들 및 Meta-K를 이용하여 동적으로 생성된 제약조건에 따라 사용자 맞춤 정보를 동적 통합 생성한다. 본 연구에서는 여행자를 위한 정보제공 에 본 프레임워크를 활용하였다.
목차
1. 도입
2. 사용자 요구를 반영한 정보의 동적통합생성 프레임워크
3. i-Reader를 이용한 정보의 동적 생성
3.1 웹 문서 분할모듈 (Web DocumentDecomposition Module, WDDM)
3.2 정보식별모듈 (Information IdentificationModule, IIM)
3.3 정보 통합 생성 모듈 (InformationIntegration & Generation Module, IIGM)
4. i-Reader를 이용한 여행정보상품 통합
4.1 웹 문서분할모듈 (Web DocumentDecomposition Module, WDDM)
4.2 정보식별모듈 (InformationIdentification Module, IIM)
4.3 정보 통합 생성 모듈 (InformationIntegration & Generation Module, IIGM)
5. 결론 및 추후 연구사항
References