earticle

논문검색

기획논문

국어사 말뭉치의 활용 현황과 향후 과제

원문정보

Improving the Construction and Utilization of Korean Historical Corpora

허인영

피인용수 : 0(자료제공 : 네이버학술정보)

초록

영어

This paper examines the utilization of Korean historical corpora and provides perspectives on how to better utilize them, as well as considerations for future corpus construction. Compared to other humanities fields, computerization in the history of the Korean language has been relatively early, but the raw corpus has mainly been used for simple searching and dictionary compilation. In the future, it is necessary to actively construct and modify the corpora in accordance with international standards, without being constrained by space and time. In terms of utilization, the corpora should be used not only for research on the history of the Korean language and related fields, but also for creating information on lexical history, developing better tokenizers and concordancers, and training data for machine/deep learning. Finally, access to and use of the corpora should be open in terms of open science and open data.

한국어

이 글에서는 국어사 말뭉치가 어떻게 활용되어 왔는지를 살펴보고, 앞으로 국어사 말뭉치를 구축하는 데 있어 고려해야 할 사항과 함께 국어사 말뭉치 활용 방안에 대 한 관견을 제시하고자 하였다. 인문학의 다른 분야에 비하면 국어사 분야의 전산화는 비교적 이른 편이었으나, 주로 원시말뭉치가 구축되었고 단순 검색이나 사전 편찬에 활용되는 데 그쳤다. 앞으로 구축에 있어서는 국제적인 표준에 의거하여, 시공간의 제 약을 받지 않는 방식으로 말뭉치의 구축과 보완이 활발하게 이루어져야 한다. 활용에 있어서는 국어사 및 인접분야 연구나 어휘역사정보 구축은 물론이고, 더 나은 형태소 분석기와 콘코던서의 개발, 머신러닝/딥러닝 학습 등을 위해 활용할 필요가 있다. 구 축․보완되는 말뭉치의 접근과 사용은 오픈 사이언스․오픈 데이터라는 관점에서 반드시 개방적으로 이루어져야 한다.

목차

요약
1. 머리말
2. 국어사 말뭉치의 활용 현황
3. 국어사 말뭉치 활용의 선결 과제
4. 국어사 말뭉치의 활용 방안
5. 맺음말
참고문헌
Abstract

저자정보

  • 허인영 Heo, Inyeong. 인하대학교 한국어문학과 조교수

참고문헌

자료제공 : 네이버학술정보

    함께 이용한 논문

      ※ 기관로그인 시 무료 이용이 가능합니다.

      • 7,500원

      0개의 논문이 장바구니에 담겼습니다.