


개화기 국어 말뭉치 구축 현황과 개선 방안 연구


A Study on the Status of Korean Corpus Establishment in the Modernization Period and Plan for Improvement


피인용수 : 0(자료제공 : 네이버학술정보)



The purpose of this study is to reveal the status of Korean corpus establishment in the modernization period and measures for improvement. Up until now, the corpus in the modernization period has been accumulated separately to some extent; however, it is difficult to analyze and utilize it profoundly because the data are not consistent and compatible, and also, most data are unreleased, and even if they are opened, only search results can be viewed. To solve this problem, first, it is necessary to prepare common information and input guidelines that must be included when a corpus is built. In particular, principles on spacing or processing Chinese characters should be established. In order to build a tagged corpus, too, it is necessary to present both old and modern forms of words to increase user convenience for researchers. Macroscopically, to computerize language data in a specific genre among research groups as much as possible, it is needed to build up a system for task division and cooperation and seek methodology to establish a balanced corpus by period and by genre. Particularly, there is an urgent need to establish a platform to share data according to the principle of reciprocity.


이 연구는 개화기 국어 말뭉치 구축 현황과 개선 방안을 밝히는 것을 목적으로 한 다. 그 동안 개화기 말뭉치도 어느 정도의 규모가 개별적으로 축적되었지만, 자료 간 의 일관성과 호환성이 떨어지고 대부분의 자료가 미공개되거나 공개되더라도 검색 결 과만을 볼 수 있어 개화기 말뭉치에 대한 다양한 분석과 활용이 어렵다. 이를 극복하기 위해서는 다양한 장르를 대상으로 한 말뭉치 구축 지침을 마련해야 한다. 특히, 띄어쓰기 및 한자 처리에 대한 원칙 마련이 시급하다. 주석말뭉치 구축을 위해서도 다양한 장르를 대상으로 하되, 연구자들의 이용의 편이성을 높이기 위해 고 어형과 현대어형을 동시에 제시할 필요가 있다. 거시적으로는 연구 그룹 간 특정 장 르(신문, 잡지, 신소설, 교과서 등)의 언어 자료를 최대한 발굴․전산화하기 위한 분업 및 협업 체계 수립, 개화기 국어 말뭉치 구축 시 반드시 포함해야 할 공통 정보 및 입 력 지침 마련, 시기별․장르별 균형 말뭉치 구축 방법론 모색 등이 이루어져야 한다. 특히, 상호주의적 원칙에 따라 자료를 공유할 수 있는 플랫폼 구축이 절실히 필요하다.


1. 서론
2. 본론
3. 결론


  • 김진해 Kim, Jinhae. 경희대학교 후마니타스칼리지 교수


자료제공 : 네이버학술정보

    함께 이용한 논문

      ※ 기관로그인 시 무료 이용이 가능합니다.

      • 8,700원

      0개의 논문이 장바구니에 담겼습니다.