earticle

논문검색

A Preference Study of Naming Children Based in the Big Data

원문정보

빅데이터 기반한 자녀의 작명 선호도에 관한 연구

Nam, Sootai, Jin, Chanyong

피인용수 : 0(자료제공 : 네이버학술정보)

초록

영어

[Purpose] Big data analytics is the art of effectively analyzing structured data organized in databases, as well as unstructured data such as web documents, emails, and social data generated by the internet, social networking services, and mobile environments. Text mining is the art of finding new and useful information from unstructured text data, and it is based on natural language processing techniques to process unstructured data. In other words, preprocessing is the process of turning unstructured data into structured data to extract features. [Methodology] In recent years, most of the data types used in big data analytics are unstructured text data. The data used in this big data analysis study was based on college students from Pusan National University in Busan and Changwon National University in Changwon. First, based on the data extracted using the charting function provided by the R language, 200 data from the 1st to 200th place obtained through frequency analysis were visualized and expressed in the form of a bar graph. [Findings] The analysis shows that the most mentioned keywords are Yoojin (46), Jiwon (45), Soobin (34), Minji (29), and Jungmin (26), which are located at the bottom of the figure. The least mentioned keywords are Dawon(4), Nahyun(4), Kihwan(4), Geunyoung(4), and Kyuwon(4), which confirms. Next, we visualized and presented the first name data, including last name, from the frequency analysis in a tabular format, ranked from 1 to 100. The top name with the surname Kim is Kim Minji (13), the top name with the surname Lee is Lee Yoojin (13), and the top name with the surname Park is Park Hyunsoo (6). [Implications] Finally, the practical implications and limitations of the study are discussed and conclusions are reached based on the results of the analysis.

한국어

[연구목적] 빅데이터 분석은 데이터베이스에 잘 정리된 정형 데이터뿐만 아니라 인터넷, 소셜 네트워크 서비스, 모바일 환경에서 생성되는 웹 문서, 이메일, 소셜 데이터 등 비정형 데이터를 효과적으로 분석하는 기술을 말한다. 텍스트 마이닝 은 비정형 텍스트 데이터에서 새롭고 유용한 정보를 찾아내는 기술이라고 말할 수 있으며, 비정형 데이터를 자연어처리 (natural language processing) 기술에 기반을 두고 데이터를 가공한다. 즉 전처리를 통해 비정형 데이터에서 정형화된 데 이터로 바꾸어 특징을 추출하는 과정을 의미한다. [연구방법] 최근 빅데이터 분석에 가장 많이 사용되는 데이터 형태 대부분이 비정형 텍스트 데이터이다. 빅데이터 분석 연구에 사용된 데이터는 부산의 P 대학교와 창원의 C 대학교의 대학생을 대상으로 하였다. 먼저 R 언어에서 제공하는 차트 기능을 이용해 추출한 데이터를 기반으로 빈도 분석을 통해 얻은 1위부터 200위까지의 데이터 200개를 시각화하여 막대 그래프 형태로 표현하여 제시하였다. [연구결과] 분석결과 가장 많이 언급된 이름은 유진(46), 지원(45), 수빈(34), 민지(29), 정민(26) 순으로 나타났다. 가장 적게 언급된 키워드는 다원(4), 나현(4), 기환(4), 근영(4), 규원(4)으로 확인되었다. 다음으로 빈도 분석을 통해 얻은 성을 포함한 이름 데이터를 1위부터 100위까지 100개의 데이터로 순위가 매겨진 표 형식으로 시각화하여 제시하였다. 김씨 성을 가진 이름 중 1위는 김민지(13)이며, 이씨 성을 가진 이름 중 1위는 이유진(13)이고, 박씨 성을 가진 이름 중 1위는 박현수 (6)으로 나타났다. [연구의 시사점] 최종적으로 도출된 분석결과를 기초하여 실무적 시사점 및 연구의 한계점을 토론하고 결론에 도달하였다.

목차


Ⅰ. INTRODUCTION
Ⅱ. RELATED RESEARCH
Ⅲ. ANALYSIS METHODS
Ⅳ. BIG DATA ANALYSIS AND VISUALIZATION
Ⅴ. CONCLUSION AND DISCUSSION
REFERENCES
국문요약

저자정보

  • Nam, Sootai 남수태. Lecturer, Institute of Liberal Education, Pusan National University
  • Jin, Chanyong 진찬용. Professor, Dep. of Business Administration, Wonkwang University/Business and Economic Research Institute

참고문헌

자료제공 : 네이버학술정보

    함께 이용한 논문

      ※ 기관로그인 시 무료 이용이 가능합니다.

      • 4,800원

      0개의 논문이 장바구니에 담겼습니다.