원문정보
초록
영어
This study verifies the necessity of adding 'educational institution' as a metadata variable to the National Institute of Korean Language's Korean Learner Corpus by comparing a single-institution corpus (Yonsei University Korean Language Institute) with the multi-institution integrated corpus (NIKLC). Sub-corpora were constructed from beginner-level (1-2) writing samples, controlling for variables such as proficiency, nationality, topic, genre, and token count. Analyses included lexical diversity, average sentence length, chi-square tests, and log-likelihood ratio. Results showed statistically significant differences (p<0.001) in lexical distribution and morpheme usage, manifesting as institutional variations in style (declarative vs. polite endings) and vocabulary choice ('한국어' vs. '한국말'). These findings demonstrate the independent impact of institutional factors on learner language, proposing the addition of institution variables to enhance the balance and research potential of the NIKLC corpus.
목차
1. 서론
2. 이론적 배경 및 선행 연구 검토
3. 연구 방법
3.1. 연구 대상 및 하위 말뭉치 구축
3.2. 어휘 분포 비교 방법론: 이중 검증
4. 분석 결과
4.1. 말뭉치 거시적 특성 비교 (어휘 다양도 및 평균 문장 길이)
4.2. 어휘 분포의 동질성 및 이질성 검증
5. 결론
5.1. 연구 결과 요약
5.2. 연구의 의의 및 제언
5.3. 연구의 한계 및 향후 연구
참고문헌
부록
