

LDA를 이용한 편의점(CVS) 연구동향 토픽모델링


Topic Modeling of CVS Research Trends Using LDA

양회창, 주윤황, 조희영

The purpose of this study is to obtain information on convenience store research by confirming research trends in each academic journal published on convenience stores. Through this, not only can managers and practitioners in the convenience store industry find clues for continuous growth, but also provide information that can be used as a reference for various industries directly or indirectly related to the growth of convenience stores. For this purpose, in this study, a total of 113 papers with Korean abstracts were analyzed using the R package as a result of searching CVS or convenience stores on ScienceON. For analysis, it was performed that word frequency analysis and word clouding, LDA topic modeling, and IPA using TF and TF-IDF to calculate word frequency and weight. The analysis results are as follows. First, as a result of keyword frequency analysis and work clouding, it was confirmed that convenience store research mainly focused on factors related to security, management, and safety along with factors related to food, factors related to consumption satisfaction, and factors related to beverages. Second, as a result of TF and TF-IDF analysis, it was found that among various keywords, words such as sweetened beverage, breakfast, household, storage, hangover, and food ingredients were studied more importantly than the frequency. Third, as a result of LDA topic modeling, the appropriate number of topics was found to be 11, and these were named “store management strategy”, “management system”, and “franchise business” according to their characteristics. Finally, as a result of conducting IPA using TF and TF-IDF, it was confirmed that the keywords occupying a large proportion in the study of convenience stores were high caffeine, sweetened beverages, energy, labeling, beverages, cafes, breakfast, and security. The following conclusions could be drawn from this study. First, it can be judged that the research on convenience stores, which accounts for a significant portion of sales in the distribution industry, is being studied relatively narrowly. Therefore, it will be necessary to share information so that many researchers can perform more sophisticated research through collaboration with associations and franchisors. Second, as a result of LDA topic modeling, it can be seen that studies related to convenience stores are mainly conducted on store operation strategies and digital information related to franchise business, and hygiene of food sold such as instant food is also being studied as an area of interest. Second, working-level managers such as franchisor supervisors and convenience store operators will have to make an effort to use major research topics related to convenience stores identified through LDA topic modeling results to understand consumers and provide necessary product groups and services from the consumer’s point of view. Lastly, the IPA results suggest that a review of social responsibility for convenience stores to limit adolescents' caffeine addiction and consumption of high-sugar beverages, and the franchisor's various research efforts on unmanned convenience stores and security are necessary.


본 연구의 목적은 편의점에 대해 발표한 각 학술지의 연구 동향을 확인하여 편의점 연구에 대한 정보를 획득함으로써 편의점 업계에 종사하는 경영자와 실무자들에게 지속적인 성장을 위한 단서들 을 찾을 수 있도록 할 뿐 아니라, 편의점의 성장과 직·간접적으로 관련이 있는 다양한 업종들에 참 고가 될 정보를 제공하고자 한 것이다. 이를 위해 본 연구에서는 ScienceON(www.scienceon.kisti.re.kr)에서 CVS 또는 편의점으로 검색 한 결과 국문초록이 탑재되어 있는 논문 총 113건을 R 패키지를 활용하여 분석을 실시하였다. 분석 은 출현단어에 대한 빈도분석 및 워드클라우딩, LDA 토픽모델링 분석과 함께, 단어빈도와 비중을 계산하는 TF, TF-IDF를 이용한 IPA를 실시하였다. 분석 결과는 다음과 같다. 첫째, 키워드 빈도분석 및 워드클라우딩 결과 편의점 연구는 식품과 관련된 요인들과 섭취 만족과 관련된 요인들, 음료와 관련된 요인들과 함께 경비·관리 및 안전과 관 련된 요인들이 주로 연구되고 있는 것으로 확인되었다. 둘째, TF, TF-IDF 분석 결과 다양한 키워 드를 중에서도 가당음료, 아침식사, 세대 등과 저장, 숙취, 식재료와 같은 단어들이 빈도에 비해 중 요하게 연구된 것을 알 수 있었다. 셋째, LDA 토픽모델링 결과 적정 토픽수는 11개로 나타나 이를 각각 특성에 맞게 “매장운영전략”, “관리시스템”, “가맹사업” 등으로 명명하였다. 마지막으로 TF, TF-IDF를 활용하여 IPA를 실시한 결과 편의점 연구에서 큰 비중을 차지하고 있는 키워드는 고카 페인, 가당음료, 에너지, 표시, 음료, 카페, 아침식사, 경비 등인 것으로 확인되었다. 본 연구를 통해 다음과 같은 결론을 내릴 수 있었다. 첫째, 유통업계에서 상당한 매출 비중을 차 지하고 있는 편의점에 대한 연구가 상대적으로 편협하게 연구되고 있는 것으로 판단할 수 있었다. 따라서 협회 및 가맹본부와의 협업을 통해 많은 연구자들이 좀 더 정교한 연구를 수행할 수 있는 정보 공유 등의 노력이 필요할 것이다. 둘째, 가맹본부 슈퍼바이저와 같은 실무담당자와 편의점 운 영자들은 LDA 토픽모델링 결과를 통해 확인한 편의점과 관련된 주요 연구 토픽을 활용하여 소비 자를 이해하고 소비자의 관점에서 필요한 상품군과 서비스를 제공하는 등 현업에 적용하기 위한 노 력을 아끼지 않아야 할 것이다. 마지막으로 IPA 결과는 편의점이 청소년들의 카페인 중독, 고가당 음료 섭취 등을 제한할 수 있도록 하는 사회적 책임차원의 검토와 무인 편의점과 경비분야에 대한 가맹본부의 다양한 연구노력이 필요할 것임을 시사 하였다.


Ⅰ. 서론
Ⅱ. 편의점과 LDA 토픽모델링
1. 편의점
2. LDA 토픽모델링
Ⅲ. 연구조사방법
1. 연구절차 및 분석도구
2. 자료 수집
3. 전처리
Ⅳ. 실증분석
1. 키워드 빈도분석 및 워드클라우딩
2. TF, TF-IDF 분석 결과
3. LDA 기반 토픽모델링
4. TF, TF-IDF를 활용한 IPA
Ⅴ. 결론 및 제언


  • 양회창 Yang, Heo Chang. 장안대학교 유통경영과 교수
  • 주윤황 Ju, Yoon Hwang. 장안대학교 온라인쇼핑과 교수
  • 조희영 Cho, Hee Young. 세종대학교 산업대학원 겸임교수


