원문정보
초록
한국어
‘디지털 트윈(Digital Twin)’은 4차산업혁명의 주요 기술들로 유통물류 산업에서 크게 각광받고 있는 기술이다. 현실에 적용하기 전에 가상 환경 공간에서 시뮬레이션을 통해 결과를 예측할 수 있기에 시간이나 비용적인 측면에서 큰 도움을 받을 수 있다. 하지만 디지털 트윈은 아직까지 획일화된 정립이나 사람마다의 기술의 이해도가 다소 부족한 부분이 있다. 이러한 디지털 트윈 기술의 이해와 활용도를 제고하고자 트렌드 분석 연구 방법을 제안하고자 한다. 본 연구는 디지털 트윈에 대한 대중들과 언론의 인식이 어떻게 변화하였는지를 파악하기 위하여, 시기별로 디지털 트윈에 대한 인식의 흐름을 뉴스 데이터를 기반으로 확인하고, 전처리 된 데이터를 시각화(Pandas, Tableau)하여 변화에 대한 데이터의 흐름을 파악하고자 한다. 본 연구에서는 데이터를 분석하기 위해서 파이썬 라이브러리인 Selenium을 통해 웹 크롤링을 하여 데이터를 수집하였고, 수집된 데이터에 대한 칼럼의 프로세싱 과정 이후 불용어 처리를 위해 불용어 사전을 정의하고 정의된 불용어 사전을 통해 데이터 훈련할 때마다 생겨나는 불용어들을 사전에 저장하고 계속해서 데이터를 정제한다. 이후 머신러닝을 통해 분류 작업을 거쳐 결과물을 도출하고, 이후 파이썬 라이브러리인 Pandas와 시각화 전문 툴인 Tableau를 활용하여 시각화 및 통계 작업을 수행한다. 도출된 결과를 바탕으로 다각도의 디지털 트윈 연구 방향성을 대한 시사점을 제시하고자 한다. 본 연구는 뉴스 데이터 웹 크롤링과 데이터 분석 및 불용어 전처리를 통하여 디지털 트윈 기술의 동향과 언론의 인식을 효과적으로 분석할 수 있다는데 학술적 의의가 있다.
목차
1. Introduction
2. Related work
3. Digital Twin
4. Process
4.1 Data collection
4.2 Dataset creation and EDA
4.3 Stopword
5. Framework
6. Result
7. Conclusions
7.1 Summary
7.2 Future work
Acknowledgments
References
