원문정보
Analysis of Research Trends on startup Business Performance Using Natural Language Processing(NLP)-Based Text Mining : Focusing on RISS DB
초록
영어
This study aims to systematically analyze domestic research trends on startup business performance using text mining techniques based on natural language processing (NLP). Abstracts were collected through web crawling from the RISS (Korea Education and Research Information Sharing Service) database using the keywords “startup business performance” and “startup management” across all available years, resulting in a final dataset of 323 academic papers. During the analysis process, various methods were applied, including morphological analysis, term frequency (TF), term frequency–inverse document frequency (TF-IDF), N-gram analysis, network analysis, and CONCOR clustering. The analysis revealed that core keywords such as “entrepreneurship,” “regulation”, “impact”, “innovation”, and “technology” emerged as central themes. Major research areas included funding, technological innovation, policy support, and entrepreneurship. Furthermore, the structural relationships among keywords were identified, and seven clusters were derived. This study contributes to the literature by offering a data-driven perspective that distinguishes itself from prior qualitative research. Future studies should consider time-series analysis, comparative analysis of international research trends, and the application of machine learning techniques.
한국어
본 연구는 자연어 처리(NLP) 기반 텍스트 마이닝 기법을 활용하여 스타트업 경영성과에 대한 국내연구 동향을 체계적 으로 분석하는 것을 목적으로 한다. 한국교육학술정보원(RISS)에서 ‘스타트업 경영성과’, ‘스타트업 경영’을 키워드로, 전 기간의 초록을 웹 크롤링하여 수집하였으며 최종 323편의 문헌이 분석에 활용되었다. 분석과정에서 형태소분석, 단어빈도분석(TF), 역 문서 빈도분석(TF-IDF), N-gram 분석, 네트워크 분석, CONCOR 기법이 적용되었다. 분석결과, ‘창업’, ‘규제’, ‘영향’, ‘혁신’, ‘기술’과 같은 키워드가 핵심 주제로 도출되었으며, 자금 조달, 기술 혁신, 정책 지원, 기업가 정신이 주 연구 분야로 확인되었다. 키워드 간 구조적 연관성을 파악하였으며 7개의 군집을 도출하였다. 본 연구는 데이터 기반 분석을 통해 기존 문헌과의 차별성을 제시하였다. 향후 연구에서는 시계열 분석, 해외연구 동향분석, 머신러닝 기법을 활용한 연구가 필요할 것이다.
목차
Abstract
1. 서론
2. 선행연구
2.1 스타트업 (startup)
2.2 경영성과
2.3 스타트업 경영성과의 배경
2.4 자연어 처리(NLP)
2.5 텍스트 마이닝
3. 연구방법 및 자료분석절차
3.1 빅데이터 분석 과정 및 체계
3.2 데이터 수집 웹 크롤링
3.3 데이터 전처리 및 데이터 분석
3.4 분석
4. 연구결과
4.1 단어빈도 및 TF-IDF 분석
4.2 N-gram 분석
4.3 네트워크 분석
4.4 CONCOR
5. 결론
REFERENCES
