원문정보
Big Data Analysis on AI Hallucination : Focusing on LDA Topic Modeling and Sentiment Analysis
초록
영어
With the rapid development of AI technology and the increasing use of generative AI, solving the problem of AI hallucination has become an important issue. AI hallucination, which produces misleading information or unrealistic results, hinders the reliability and transparency of AI and can cause social disruption, so systematic research is needed. While most of the previous studies have been conducted from a technical perspective, this study aims to provide a new perspective on the social issues related to AI hallucination through big data analysis techniques. This study utilized keyword frequency analysis, LDA topic modeling, and sentiment analysis to analyze the AI hallucination problem. The research data was analyzed based on data collected from January 1, 2023 to May 31, 2024, the period after the launch of ChatGPT. 11 topics were derived through LDA topic modeling and public perceptions were classified into positive, neutral, and negative by sentiment analysis. Based on the research results derived in this way, we identified issues related to AI hallucination and identified public perceptions and reactions to AI hallucination, the biggest issue related to generative AI. Unlike existing prior research, this approach has a significant difference in research methods, presents new perspectives on AI hallucination-related research, and can provide academic and policy implications for the development direction and policy establishment of AI technology.
한국어
AI 기술의 급속한 발전과 함께 생성형 AI의 활용이 증가함에 따라 AI 할루시네이션 문제를 해결하는 것이 중요한 과제로 부상하고 있다. 잘못된 정보나 비현실적인 결과물을 생성하는 AI 할루시네이션은 AI의 신뢰성과 투명성을 저해하며, 사회적 혼란을 초래할 수 있기 때문에 이에 대 한 체계적인 연구가 필요하다. 기존 선행연구는 대부분 기술적 측면에서 진행되었으나, 본 연구 에서는 빅데이터 분석 기법을 통해 AI 할루시네이션 관련 사회문제에 대한 새로운 시각을 제시 하고자 한다. 본 연구는 AI 할루시네이션 문제를 분석하기 위해 키워드 빈도분석, LDA 토픽 모델링과 감성 분석을 활용하였다. 연구 데이터는 ChatGPT 출시 이후의 기간인 2023년 1월 1일부 터 2024년 5월 31일까지 수집된 자료를 기반으로 분석하였으며, LDA 토픽 모델링을 통해 11개 의 토픽을 도출하였고, 감성 분석을 통해 대중의 인식을 긍정, 중립, 부정으로 구분하여 제시하 였다. 이와 같이 도출된 연구결과를 바탕으로 AI 할루시네이션 관련 이슈를 파악하고, 생성형 AI 관련 최대 이슈인 AI 할루시네이션에 대한 대중의 인식 및 반응을 파악하였다. 이러한 접근은 기 존 선행연구와 달리, 연구방법에 있어 큰 차별성을 가지며, AI 할루시네이션 관련 연구 분야에 새로운 시각을 제시하고, AI 기술의 발전 방향과 정책 수립에 학문적 및 정책적 시사점을 제공할 수 있을 것이다.
목차
Ⅰ. 서론
Ⅱ. 이론적 배경 및 선행연구
Ⅲ. 연구방법
Ⅳ. 연구결과
Ⅴ. 논의 및 결론
참고문헌
【Abstract】
