earticle

논문검색

디지털 기술

인보이스 서류 영상의 테이블 헤더 문자 분류를 통한 구매 정보 추출 모델

원문정보

Purchase Information Extraction Model From Scanned Invoice Document Image By Classification Of Invoice Table Header Texts

신현경

피인용수 : 0(자료제공 : 네이버학술정보)

초록

영어

Development of automated document management system specified for scanned invoice images suffers from rigorous accuracy requirements for extraction of monetary data, which necessiate automatic validation on the extracted values for a generative invoice table model. Use of certain internal constraints such as “amount = unit price times quantity” is typical implementation. In this paper, we propose a noble invoice information extraction model with improved auto-validation method by utilizing table header detection and column classification.

한국어

스캔된 인보이스에 특화된 서류 관리 자동화 시스템 구축에있어서 추출된 금전적 데이터의 정확도에대한 엄격한 요구는 인보이스 테이블을 위한 발생적 모델 설계에서 자체 인증 절차를 포함하는 것을 필요로 한다. 가격 = 단가 x 구매수량과 같은 내부적 관계식을 활용한 단순한 인증 절차를 사용하는 것이 전형적 방법론이다. 본 논문에서는 영상내 테이블 헤더 부분의 탐색과 탐색된 헤더의 컬럼 구분자를 활용하는 개선된 자동 인증 절차를 갖춘 인보이스내 정보 추출 모델을 제안한다.

목차

요약
 Abstract
 I. Introduction
 2. Previous Research
 3. Table Header Localization and Header Column Classification
 4. Experiments
 Reference

저자정보

  • 신현경 Hyunkyung Shin. 가천대학교 수학정보학과 조교수

참고문헌

자료제공 : 네이버학술정보

    함께 이용한 논문

      ※ 기관로그인 시 무료 이용이 가능합니다.
      ※ 학술발표대회집, 워크숍 자료집 중 4페이지 이내 논문은 '요약'만 제공되는 경우가 있으니, 구매 전에 간행물명, 페이지 수 확인 부탁 드립니다.

      • 4,000원

      0개의 논문이 장바구니에 담겼습니다.