원문정보
초록
한국어
최근 MIT에서 NO Code AI와 ML기법이 대두되면서 여러가지 생성형 AI의 활용에 귀추가 주목되고 있다. 생성형 AI들 중 비전공자들이 가장 접하기 쉬운 형태가 AI 챗봇플랫폼의 형태인 챗GPT이다. 너무나 빠른 변화의 파도 속에서 23년 02월 국민대에서는 ‘챗GPT 윤리강령’을 발표하였고, 고려대에서는 ‘챗GPT 활용가이드라인’을 공개하면서 학계에도 AI챗봇 플랫폼이 스며들기 시작했다. 이에 다양한 도메인을 지닌 현장 전문가들이 효과적인 데이터 분석을 할 수 있게 되었으며, 쉽게 인사이트 도출이 가능해졌다. 이렇게 본인의 영역에서 데이터 비전문가이지만 현장전문가로서 데이터 분석을 하는 사람들을 우리는 시티즌데이터사이언티스트(Citizen Data Scientist, 이하 CDS)라 한다. 본 연구에서는 코드적 관점으로 로코딩툴(Low Coding Tool)의 대표적 사례인 챗GPT와 연구자의 직접코딩의 분석 정확성을 비교 확인하고자 한다. 데이터는 I-Cheng Yeh(2007)이 제공하는 UCI Repository의 Concrete Compressive Strength.csv 데이터를 활용하였다. 평가지표로는 MAE, MAPE, MSE, MSLE를 활용하였다. 이 연구의 공헌은 로코딩(Low Coding)과 직접코딩 간의 비교로 챗GPT와 같은 효과적인 개발 툴을 통해 데이터분석 비전공자, 비전문가들이 인공지능(AI)을 쉽게 구현 및 적용할 수 있고 그에 따라 시민데이터과학자라는 새로운 영역에 일조할 수 있다는 데 있다.
목차
Ⅰ. 서론
Ⅱ. 이론적 배경
2.1 챗GPT
2.2 데이터 리터러시(Data Literacy)
2.3 시티즌데이터사이언티스트(CDS)
Ⅲ. 연구 방법
3.1 데이터의 특징
3.2 연구수행- 간단한 분석질의
3.3 연구수행- 구체적 분석질의
Ⅳ. 연구 결과
4.1 직접코딩의 분석결과 - 회귀분석
4.2 챗GPT의 분석결과 - 회귀분석
Ⅴ. 결론
참고문헌
