원문정보
Design of Product Information Collection System for Personalized Recommendation and Dose Guide Service of Health Functional Food
초록
영어
We need product information(e.g. containing ingredient, content, dose guide, etc.) for providing personalized recommendation and dose guide service to users who lack technical expertise in health functional food. However, almost shopping malls represent detailed product information as mixture of atypical texts, text images and images. And this cause limit in crawling several types of information in shopping malls. In this paper, we propose and implement a system that collects detailed product information in various shopping malls consisting of atypical texts and text images by applying text mining and image analysis technique. Through the experiment of the proposed system, it was confirmed that more than 99% of atypical texts was extracted and more than 93% of text images. In addition, the recognition rate was 97% by correcting the error-extraction of the open source OCR engine used to convert text images into digital text. The proposed system can be used to extract meaningful information from web-based shopping malls provided in various types.
한국어
건강기능식품에 대한 전문지식이 부족한 사용자에게 개인맞춤 추천 및 복용가이드 서비스를 제공하기 위 해서는 개인 특성정보뿐만 아니라 함유성분, 함유량, 복용방법 등의 상세한 상품정보가 필요하다. 하지만 대부분의 건강기능식품 쇼핑몰이 상품정보를 비정형 텍스트, 텍스트 이미지, 영상이 혼합된 형태로 제공하고 있어, 다양한 형태의 정보 수집에 한계가 있다. 이 논문에서는 다수의 쇼핑몰을 대상으로 텍스트 마이닝과 영상분석 기술을 이 용하여 비정형 텍스트와 텍스트 이미지 형태로 제공되는 상품 상세정보를 수집할 수 있는 시스템을 제안하고 구 현한다. 제안 시스템의 실험을 통해, 텍스트 형태의 상품정보는 99%이상 추출하고, 텍스트 이미지 형태의 상품정 보는 93%이상 수집하는 것을 확인하였다. 또한, 텍스트 이미지를 디지털 텍스트로 변환하기 위해 사용한 오픈소 스 OCR 엔진의 오추출을 교정하여 인식률 97%를 기록하였다. 제안한 시스템은 다양한 형태로 제공되는 웹기반 쇼핑몰에서 의미있는 정보 추출에 활용될 수 있다.
목차
Abstract
Ⅰ. 서론
Ⅱ. 관련 연구
2.1 건기식 추천 및 복용가이드 서비스
2.2 건기식 쇼핑몰 상품정보 형태 분석
Ⅲ. 제안 시스템 설계
3.1 시스템 구성
3.2 건기식 크롤러 설계
3.3 텍스트 마이너 설계
3.4 이미지 마이너 설계
3.5 데이터베이스 설계
Ⅳ. 시스템 구현 및 평가
4.1 구현 환경
4.2 구현 결과
4.3 시스템 평가
Ⅴ. 결론
REFERENCES
