원문정보
초록
영어
With the explosive growth of public data, particularly in the domains of air pollution, traffic accidents, and vaccination rates, data-driven decision-making has become increasingly critical. We propose an adaptive, scalable public data analysis framework that integrates Generative AI and Large Language Models (LLMs). Validated on three major datasets—air pollution (WAQI), traffic accidents (US DOT), and vaccination rates (WHO)—our method improves traffic accident risk prediction accuracy by up to 10 percentage points, reduces air pollution MAPE to 0.125, and enhances non-experts’ understanding by over 40%. Despite persistent challenges such as data scarcity, model bias, and the black-box problem, our findings underscore the transformative potential of Generative AI and LLMs in public policy decision-making.
한국어
공공 데이터가 폭발적으로 증가함에 따라 데이터 기반 의사결정의 중요성이 더욱 부각되고 있다. 본 연구에 서는 대기오염, 교통사고, 백신 접종률이라는 주요 공공 데이터를 활용하여, 생성형 AI와 대형 언어 모델(LLM)을 결합한 적응형·확장형 공공 데이터 분석 프레임워크를 제안한다. 검증 결과, 교통사고 위험 예측 정확도가 최대 10%p 향상되었고, 대기오염 예측 MAPE가 0.125까지 낮아졌으며, 자동 보고서 생성 및 시각화를 통해 비전문가의 이해도가 40% 이상 향상되었다. 데이터 부족, 모델 편향, ‘블랙박스’ 문제 등 윤리·법적 이슈가 여전히 존재하지만, 본 연구는 공공 정책 의사결정에서 생성형 AI와 LLM이 지닐 수 있는 혁신적 잠재력을 확인하였다.
목차
Abstract
1. 서론
2. 관련 연구
2.1 공공 데이터 분석 동향
2.2 Large Language Models와 NLP 자동화
2.3 Generative AI 시각화 기법
2.4 윤리·법적 고려와 Responsible AI
3. 연구 방법론
3.1 데이터셋 소개
3.2 프레임워크 아키텍처
3.3 구현 세부사항 및 알고리즘
4. 실험 및 결과
4.1 데이터 전처리 및 통합
4.2 LLM 기반 자연어 질의 및 보고서 생성
4.3 Generative AI 시각화 및 분석 결과
4.4 종합 논의
5. 결론 및 향후 과제
REFERENCES
