원문정보
Multilingual Ontologies-based Extraction for Cross-Language Hybrid and Semantic Search
초록
영어
The growth of multilingual web content portends the need for cross-language information retrieval. As a solution to this problem, we utilize ML-OntoES(a MultiLingual Ontology-based Extraction System). ML-OntoES enables hybrid keyword and semantic search over domain-specific, semi-structured information. Key ideas of ML-OntoES include monolingual semantic indexing and query interpretation with extraction ontologies and conceptual-level cross-language translation. A prototype implementation, along with experimental work showing good extraction accuracy in multiple languages, demonstrates the viability of the ML-OntoES approach of using multilingual extraction ontologies for cross-language hybrid and semantic search.
한국어
수많은 언어로 작성된 웹 컨텐츠의 증가로 주 언어로 작성된 정보뿐만 아니라 타 언어로 작성된 정보에 대한 검색의 필요성이 중요해지고 있다. 이를 위한 한 방법으로 본 논문에서는 특정 분야의 반구조적 정보에 대한 키워드 검색뿐만 아니라 시맨틱 검색을 지원하는 다국어 온톨리지 기반 추출 시스템인 ML-OntoES(MultiLingual Ontologybased Extraction System)를 활용한다. 다국어 온톨리지 기반 추출 시스템은 온톨리지 추출을 통하여 특정 언어 에 대한 시맨틱 인덱싱과 질의 해석, 개념 단계의 언어들 간의 교차언어 번역으로 다국어 웹 컨텐츠에 대한 질의를 처리한다. 다국어 온톨리지 기반 추출 시스템의 프로토타입 구현을 통해 높은 정확도의 다국어 웹 데이터 추출 성능 을 확인함으로써 교차언어에 대한 키워드 검색과 시맨틱 검색을 위한 다국어 추출 온톨리지를 사용하는 다국어 온톨 리지 기반 추출 시스템의 가능성을 증명한다.
목차
Abstract
1. Introduction
2. Architecture
2.1 Extraction Ontologies
2.2 Monolingual Query Processing
2.3 Cross-Language Query Processing
3. Practicalities
3.1 Recognition Accuracy
3.2 Construction Cost
4. Conclusion
참고문헌