원문정보
초록
영어
This study applies text mining techniques to NAVER News data, focusing on the keyword 'algorithm'. The aim was to identify and analyze the major trends and topics related to 'algorithm' within the news data. The process involved data collection, preprocessing, feature vectorization, and topic modeling.Data collection was performed using the NAVER API, targeting news articles that contained the keyword 'algorithm'. The collected data underwent text preprocessing to transform it into a format suitable for analysis. Subsequently, feature vectorization converted the text data into a numerical form that machine learning algorithms can process. Topic modeling techniques, such as LDA and LSA, were applied to extract and analyze the main topics.The analysis revealed that the keyword 'algorithm' holds significant importance across various news topics. Notably, topics related to technological advancements, societal impact, and business strategies were predominantly featured. This research demonstrates the effectiveness of text mining techniques in identifying and understanding trends and topics associated with algorithms in news content.
한국어
본 논문는 ‘알고리즘’이라는 키워드를 중심으로 NAVER 뉴스 데이터에 텍스트 마이닝 기법을 적용한 것이다. 연구의 목적은 뉴스 데이터에서 ‘알고리즘’과 관련된 주요 트렌드와 주제를 식별하고 분석하는 것이었다. 이를 위해 데이터 수집, 전처리, 특성 벡터화, 토픽 모델링 등의 과정을 수행하였다. 데이터 수집은 NAVER API를 사용하여 ‘알고리즘’ 키워드가 포함된 뉴스 기사를 대상으로 하였다. 수집된 데이터는 텍스트 전처리를 거쳐 분석에 적합한 형태로 변환되었다. 이후 특성 벡터화를 통해 텍스트 데이터를 머신러닝 알고리즘이 처리할 수 있는 수치적 형태로 변환하였 으며, LDA와 LSA와 같은 토픽 모델링 기법을 적용하여 주요 토픽들을 추출하고 분석하였다. 분석 결과, ‘알고리즘’ 키워드는 다양한 뉴스 주제에 걸쳐 상당한 중요성을 지니고 있음이 밝혀졌다. 특히, 기술 발전, 사회적 영향, 비즈니 스 전략 등과 관련된 토픽들이 주요하게 다루어졌다. 본 연구는 알고리즘과 관련된 뉴스 콘텐츠의 트렌드와 주제를 파악하는 데 있어 텍스트 마이닝 기법의 유용성을 입증하였다.
목차
Abstract
Ⅰ. 서론
Ⅱ. 사용 이론
1. 텍스트 마이닝
2. 특성 벡터화와 특성 추출
3. 토픽 모델링
Ⅲ. 분석 및 결과
1. 분석
2. 결과
Ⅳ. 결론
REFERENCES
