


テキストマイニングを活用した「X {まで}」構文の語彙分析 ─ 「X {さえ}」「X {も}」との比較・対照を中心に ─


Vocabulary Analysis of “X {made(until)}” Syntax Using Text Mining : Focusing on Comparison and Contrast with “X {sae(even)}” and “X {mo(also)}”


피인용수 : 0(자료제공 : 네이버학술정보)



Recently, in the era of the “Fourth Industrial Revolution”, “artificial intelligence(AI)” and “big data” have created certain issues. In such scenario, research utilizing “data mining” has been attempted in the field of humanities as well. In the current research, attempts have been made to study “Japanese particles” utilizing the “text mining” technique that emerged as a new research method in the field of Japanese language studies. It would be prudent to try “the possibility of quantitative, quantitative, and statistical analysis” in this study of the Japanese particles. The analysis target was compared and contrasted with “X {sae(even) / mo(also)}”, focusing on the Japanese particle “X {made(until)}”. The analysis engine used “KH Coder” developed by HiGuchi(樋口); however, this tool can also analyze function words such as particles. Using the KH Coder, we were able to confirm the “frequent words” and “co-occurrence network”, “correspondence analysis” and “characteristic words” of “X {made / sae / mo}” syntax which are commonly not understood through the conventional research methods. We intend to use the text mining technique more as “objective” data to analyze “keyword” derivation and “visualization” by expanding the scope of access to Japanese postpositions.


최근 제4차 산업 혁명의 시대로 접어들면서 인공 지능(AI)이나 빅 데이터 등이 이슈가 되고 있다. 이러한 변화 속에서 인문학 분야에서도 데이터 마이닝 등을 활용 한 연구가 시도되고 있다. 본 논문에서는 일본어학 분야에서 새로운 연구방법으로 대두되고 있는 ‘텍스트 마이닝’ 기법을 활용하여 ‘일본어 조사(助詞)’ 연구를 시도하였다. 따라서 본 연구는 일본어의 조사 연구에 있어서 ‘계량적・정량적・통계적 분석의 가능성’을 시도한 데 에 의의가 있다. 분석 대상은 일본어 조사 ‘X {まで(made)}’를 중심으로 ‘X {さえ(sae)/も(mo)}’와 비교・대조 고찰하였다. 분석 엔진으로는 樋口(HiGuchi)가 개발한 ‘KH Coder’를 활 용하였고, 이 툴은 조사 등의 기능어도 분석이 가능하다. 이 KH Coder를 통해 ‘X {まで/さえ/も}’ 구문의 앞에 오는 전접 요소의 ‘빈출 어’와 ‘공기 네트워크’, ‘대응분석’과 ‘특징어’를 확인할 수 있었다. 이는 기존에 없 었던 새로운 연구방법을 도입하여 일본어 조사의 분석을 시도한 것으로 그 방법의 독창성과 참신성이 인정된다. 또 실제 코퍼스 자료를 사용함으로써 실증적인 연구로 서도 인정할 수 있다. 본 연구의 텍스트 마이닝 기법은, 일본어학 연구 특히 일본어의 조사에 대한 접 근방법의 폭을 넓히고 있다. 시드 데이터 분석의 접근과 해석 방식, 키워드 도출 및 시각화 분석을 통해 명료성과 객관성을 확보하여 학제 간 연구의 자료로 활용될 것 으로 기대된다.


1. はじめに
2. 先行研究の概観および現在
3. 新たな研究方法
4. 分析と考察結果
4.1. 全体傾向
4.2. 「名詞」と「複合名詞」
5. おわりに


  • 金昭喜 김소희. 高麗大学校 中日語文学科 博士課程、日本語学


자료제공 : 네이버학술정보

    함께 이용한 논문

      ※ 기관로그인 시 무료 이용이 가능합니다.

      • 6,000원

      0개의 논문이 장바구니에 담겼습니다.