earticle

논문검색

정책

토픽 모델링 기반의 국내외 공공데이터 연구 동향 비교 분석

원문정보

Topic Modeling-Based Domestic and Foreign Public Data Research Trends Comparative Analysis

박대영, 김덕현, 김건욱

피인용수 : 0(자료제공 : 네이버학술정보)

초록

영어

With the recent 4th Industrial Revolution, the growth and value of big data are continuously increasing, and the government is also actively making efforts to open and utilize public data. However, the situation still does not reach the level of demand for public data use by citizens, At this point, it is necessary to identify research trends in the public data field and seek directions for development. In this study, in order to understand the research trends related to public data, the analysis was performed using topic modeling, which is mainly used in text mining techniques. To this end, we collected papers containing keywords of ‘Public data' among domestic and foreign research papers (1,437 domestically, 9,607 overseas) and performed topic modeling based on the LDA algorithm, and compared domestic and foreign public data research trends. After analysis, policy implications were presented. Looking at the time series by topic, research in the fields of 'personal information protection', 'public data management', and 'urban environment' has increased in Korea. Overseas, it was confirmed that research in the fields of 'urban policy', 'cell biology', 'deep learning', and 'cloud · security' is active.

한국어

최근 4차 산업혁명으로 빅데이터의 성장과 가치는 지속적으로 증가하고 있으며, 정부에서도 공공데이터 개방과 활용에 적극적으로 노력하고 있다. 하지만 여전히 시민들의 공공데이터 활용 요구수준에는 미치지 못하는 상황이며, 현 시점에서 공공데이터 분야의 연구동향 파악과 발전 방향을 모색할 필요가 있다. 이에 본 연구에서는 공공데이터와 관련된 연구 동향을 파악하기 위해서 텍스트 마이닝 기법에서 주로 활용되는 토픽 모델링을 활용하여 분석하였다. 이를 위해 국내외 학술논문 중 ‘공공데이터’, ‘Public Data'의 키워드가 포함된 논문(국내 1,437건, 국외 9,607건)을 수집하 여 LDA 알고리즘 기반의 토픽 모델링을 수행하였으며, 국내외 공공데이터 연구 동향을 비교 분석하여 정책적 시사점을 제시하였다. 분석 결과 국내의 경우 공공분야 정책 연구가 주를 이루고 있으며, 국외는 의료, 건강 관련 연구가 높게 나타났다. 토픽별 시계열로 살펴보면 국내는 ‘개인정보보호’, ‘공공데이터 관리’, ‘도시 환경’ 분야의 연구가 증가하였으 며, 국외는 ‘도시정책’, ‘세포 생물학’, ‘딥러닝’, ‘클라우드·보안’ 분야 연구가 활성화되고 있음을 확인할 수 있었다.

목차

요약
Abstract
1. 서론
2. 선행 연구 분석
2.1 공공데이터를 활용한 선행 연구
2.2 연구 동향 분석 선행 연구
2.3 이론적 고찰(LDA:Latent Dirichlet Allocation)
3. 데이터 수집 및 분석 방법
3.1 데이터 수집 및 전처리
3.2 분석 방법
4. 분석 결과
4.1 키워드 빈도 분석
4.2 분야별 연구 동향 분석
4.3 토픽 모델링 분석
5. 결론
5.1 분석 결과 요약
5.2 정책적 시사점 및 연구의 한계
REFERENCES

저자정보

  • 박대영 Dae-Yeong Park. 영남대학교 경영학과 학부과정
  • 김덕현 Deok-Hyeon Kim. 경북대학교 통계학과 학부과정
  • 김건욱 Keun-Wook Kim. 대구디지털산업진흥원 빅데이터활용센터 센터장

참고문헌

자료제공 : 네이버학술정보

    함께 이용한 논문

      ※ 기관로그인 시 무료 이용이 가능합니다.

      • 4,300원

      0개의 논문이 장바구니에 담겼습니다.