옛한글 문서의 전자문서화와 정보공유 방법 제안


Digitization of Old Korean Texts with Obsolete Korean Characters and Suggestion for Improvement of Information Sharing

김하영, 유우식

A vast amount of materials—such as prints, woodblock prints, manuscripts, old novels, and letters—written in old Korean and using old grammar and/or obsolete characters, are collected in many institutions, including the Jangseogak at the Academy of Korean Studies. Digitization of these texts has required a prolonged manual inputting process. Individual researchers, who majored in old Korean, have read and typed the characters into electronic documents, which depends upon individual skill, effort, and approach, and is particularly limiting because none can be significantly increased. To date, only a small proportion of the old Korean document collections, currently kept in storage, have been digitized and made available to the public. Even the electronic formats of the texts prove difficult to displaying correctly, due to the incompatibility between the old Korean characters and the character set on today’s electronic devices. To improve the techniques and efficiency of digitizing old Korean texts, it is necessary to develop optical character recognition (OCR), which will analyze images of old Korean documents, as well as input, display, and storage methods.


옛한글로 저술된 자료는 활자 인쇄본, 목판 인쇄본, 필사본, 고소설, 서간 등 방대한 자료 가 한국학중앙연구원 장서각을 비롯하여 많은 기관에 소장되어 있다. 옛한글을 전산정보화하기 위해서는 수작업에 의한 ‘입력’과정이 필요하다. 옛한글 문서의 전자문서화 작업이 오랫동안 진행되어 왔으나 옛한글을 전공한 연구자 개인의 노력으로 옛한글을 읽고 입력하여 전자자료화 되고 있는 실정이다. 연구자의 숙련도가 개인적인 작업능력의 향상에 머무르고 기술의 축적으 로 이어지지 못한다. 현재까지 극히 일부분의 옛한글 문서만이 소개되고 대부분의 자료는 수장 고에 보관되어 있는 상태이다. 어렵게 전자문서화된 옛한글 고문서도 전자기기 간의 호환성 문제로 정보 공유 및 표시에도 어려움이 있다. 옛한글 문서의 전자문서화의 작업효율을 높이고 전자문서화 기술의 축적을 위해서는 옛한글의 입력, 표시, 저장 방법의 개선을 비롯하여 옛한글 문서의 이미지 분석을 통한 광학적 문자인식(OCR)의 개발이 필요하다.


1. 서론
2. 옛한글 자료의 전자문서화
2.1. 현대 한글과 옛한글
2.2. 한글 전자문서화의 어려움
2.3. 옛한글 전자문서화를 위한 입력방법
2.4. 옛한글 자료의 온라인 열람과 검색
3. 한글의 광학적 문자인식(OCR)
4. 고찰 및 결론


  • 김하영 Ha Young Kim. 한국학중앙연구원 장서각
  • 유우식 Woo Sik Yoo. 웨이퍼마스터스, 미국 캘리포니아주 더블린시, 경북대학교 인문학술원


