earticle

논문검색

日本言語

LDA 토픽모델링 기법을 활용한 소셜미디어의 일본 관련 텍스트의 토픽 분석

원문정보

Topic Analysis of Japan-Related Texts on Social Media Using LDA Topic Modeling Technique

김유영

피인용수 : 0(자료제공 : 네이버학술정보)

초록

영어

This study applies the topic modeling technique, a prominent method in text mining, to the field of Japanese studies, aiming to address the challenges posed by the growing volume of textual data. To provide a deeper understanding of Korean interest in Japan, the research focuses on social media data generated by the ordinary users, rather than traditional mass media sources. Specifically, the study collected and constructed a corpus from ten years of Japan-related blog posts on the Korean platform Naver, which was then analyzed using topic modeling. The analysis revealed that these Japan-related blog posts could be broadly categorized into six topics. Based on the frequent keywords associated with each topic, these were identified as "Travel," "Economy," "Learning," "Shopping," "Popular Culture," and "Japanese Cuisine." The findings indicate that Koreans primarily view Japan as a travel destination, followed by its significance as an economic entity in international relations, a subject of study or destination for learning the Japanese language and culture, a shopping destination, a source of popular culture, and a provider of culinary experiences. These patterns demonstrate that topic modeling effectively identifies themes and consumption patterns, reflecting real-world social phenomena. This study underscores the potential of data mining, particularly topic modeling, in Japanese studies by enabling the analysis of large-scale textual data and deriving meaningful insights. However, limitations include the consolidation of data into a single set for analysis and the restriction of data collection to specific periods within each year. Future research should extend the data collection timeframe and incorporate data from other social media platforms to capture evolving trends in Korean interest in Japan over time.

일본어

本稿では、増大するテキストデータの効率的な活用を目指し、テキストマイニン グ手法の一つであるトピックモデルを日本学分野に導入した。また、韓国人の日本に 対する関心の様相をより鮮明に解明するため、従来のマスメディアによって生成され たビッグデータではなく、一般大衆によって生成されたソーシャル・ビッグデータを 対象にテキストマイニングを行った。具体的には、10年間にわたる韓国・Naver社の ブログの「日本」に関連する投稿テキストを収集し、コーパスを構築した後、これに対 してトピックモデル分析を実施した。 その結果、本研究では、日本に関連するブログ投稿を大きく6つのトピックに分類 することができた。各トピックにグループ化された頻出キーワードに基づき、それぞ れのトピックを「旅行」、「経済」、「学習」、「買い物」、「大衆文化」、「和食」と解釈し た。これにより、韓国人の日本に対する最大の関心は「旅行」トピック、すなわち「旅 行地或いは観光地としての日本」であり、その次に「国際関係における経済主体として の日本」、「学習の対象または留学先としての日本語および日本」、「商品の購入先とし ての日本」、「大衆文化の発信地としての日本」、「食文化および飲食産業の側面からの 日本」への関心が続いていることが確認された。また、このような韓国人の「日本」に 対する関心と消費の様相は、実際の社会現象を正確に反映していることから、トピッ クモデルの可能性が再確認されたといえる。したがって、日本学分野においても、 データマイニング、特にトピックモデル分析を用いることで、大規模なビッグデータ を処理し、有意義な分析結果を導き出すことが可能であり、今後さらに広く応用され る可能性がある点でも本研究には意義があると考えられる。 しかしながら、本研究では10年間のデータを調査したものの、全てのデータを一 つにまとめて処理し分析を行った点、調査対象期間全体のデータではなく、1年を四 半期に分け、特定の期間に限定して資料を収集した点において、限界があるといえ る。今後の研究では、調査期間を拡大するとともに、他のソーシャルメディアにまで 調査対象を広げることで、データ量を増加させ、時間の経過による韓国人の日本に対 する関心トピックの変化をより深く理解することを目指したい。

목차

1. 들어가며
2. 선행연구 및 문제제기
2.1 텍스트 마이닝(Text Mining)
2.2 토픽모델(Topic Model)과 소셜 빅데이터 분석
3. 조사 대상 및 연구방법
3.1 조사 대상 및 자료 수집 툴
3.2 데이터 전처리
3.3 데이터 분석
4. LDA 분석 및 결과
4.1 LDA에 의한 토픽 개수 설정
4.2 LDA에 의한 토픽 모델링
4.3. 토픽 분석
5. 나가며
【参考文献】

<要旨>

저자정보

  • 김유영 Kim, YuYoung. 동덕여자대학교 일어일본학과 부교수, 일본어학

참고문헌

자료제공 : 네이버학술정보

    함께 이용한 논문

      ※ 기관로그인 시 무료 이용이 가능합니다.

      • 6,300원

      0개의 논문이 장바구니에 담겼습니다.