초록 열기/닫기 버튼

19세기 서구 선교사와 외교관들이 조선에 들어오면서 본격적으로 조선에 관한 기록을 자국어로 남기기 시작했고, 대부분의 자료는 본국에 있는 교단이나 정부 기관에 보내졌다. 이때 문제가 되는 것 중 하나가 조선의 지명, 인명 등 고유명사를 위시한 한국어를 자국어로 표기하는 방식이다. 이에 따라 동질 집단에서 한국어를 자국어로 표기하는 방식에 일관성을필요로 하게 되었다. 이들은 자국어 문자에 사용되는 로마자를 이용하게 되었고, 기록물을 생산했던 시기, 이들의 모국어, 로마자 표기의 목적 등에 따라 매우 다양한 표기 방식으로 나타났다. 개항 이후 기록물에 가장 많이 사용된 방식은 매큔-라이샤워 표기법(MR)과 2000년에 개정된 문화관광부의 ‘국어의 로마자 표기법’(KR)이다. MR은 1939년에 제안되어 지금까지 영어권 문서에 가장 많이 채택되었다. MR은 단순히 한글 철자를 로마자로 치환한 전자법(轉字法)이 아니라, 한국어의 음성/ 음운론적 변화를 고려한 전사법(轉寫法)이다. 해방 이후부터 한국 정부는 로마자 표기법을 4차례에 걸쳐 제정․공포하였고, 현재까지 최종안인 KR은 전사법을 원칙으로 하나, 목적과 특성에 따라 1개의 한글 표기에 6개 상이한 로마자 표기를 인정함으로써 가장 복잡한 방식이 된다. 문제는 MR과 KR 간 호환성이 없다는 것이다. 따라서 MR 방식을 채택한 문서를 KR 방식으로 검색할 수 없으며, 이는 역의 경우도 마찬가지이다. 또한, 다른 표기법 사이에서도 호환성이 결여되어 검색 시 등가 정보를 찾을 수 없는 문제가 발생한다. 본 논문에서는 자동 한국어-로마자 표기변환 소프트웨어인 Kor-Rom 시스템의 2개 버전을 소개한다. Kor-Rom 1.0은 최신 자연언어처리 기술을 이용하여 KR 방식의 한국어-로마자 표기 변환을 지원한다. Kor-Rom 2.0은 MR 방식을 지원함과 동시에 KR과 MR 간 호환성을 제공한다. 이를 바탕으로 본 연구에서는 KR과 MR을 포함하여 다양한 한국어 로마자 표기법 간의 호환성을 지원할 수 있도록 Kor-Rom 시스템의 후속 버전을 설계한다. 새롭게 설계된 Kor-Rom 시스템은 특히 해외 문서고에 잠자고 있는 한국학 관련 자료에서 로마자 표기가 다르나 등가적인 정보를 효과적으로 검색할 것이다.


Since mid 19th century when western missionaries and diplomats entered Korea, they began to produce numerous documents on Korea, and considerable amount of the documents were sent to their countries on various purposes, including political, economical, or religious ones, just to mention a few. One of the problems they have faced when producing documents was to maintain consistency in naming Korean entities. They had to transliterate or transcript a large number of Korean entities’ names or Korean words in Roman Alphabets, when the entities could not be translated. The transliteration or transcription methods turned out to be diverse according to the period of their activities in Korea, their mother tongues, the purposes of their documents, and so on. Most productive romanization methods are McCune-Reischauer Romanization (MR) and that proposed by Korean government in 2000 (KR). MR was formulated in 1939, and it has been adopted until now by most important English documents. MR is a transcription of Korean pronunciation, not a simple transliteration of Korean alphabets: i.e. most of Korean phonetic and phonological changes are reflected in MR. Korean government proposed its own romanization, and revised it several times. KR, the final version up to now, was announced in 2000. KR is the most complicated transcription system, since it provides 6 different results in roman alphabets for 1 Korean word. The most serious problem is that MR and KR are not compatable, thus a document adopting MR cannot be searched when users or librarians ignore KR, vice versa. Same problems occur for other romanization methods. In this paper, two versions of the developed Korean-Romanization system (Kor-Rom) are introduced: Kor-Rom 1.0 implemented KR method, using art-of-the-state Natural Language Processing techniques; Kor-Rom 2.0 implemented KR and MR methods, guaranteeing their compatibility. Finally, this paper designs the future versions of Kor-Rom system, which will supporting a large number of Romanization methods, as well as KR and MR. The future versions of Kor-Rom system will enable users and librarians to search efficiently equivalent information in differently romanized Korean documents, especially which are still dormant in oversea muniment rooms and libraries.