원문정보
초록
영어
This study empirically analyzes AI Hub user behavior using large-scale log data from 2024 to 2025, addressing the growing demand for high-quality training data. We applied Association Rule Mining and Social Network Analysis (SNA) to visualize structural consumption patterns. Results confirm a divergence: individual users prefer web-based exploration, while organizations are shifting toward API-based automation. Network analysis reveals that text data acts as a central “anchor” with broad connectivity, whereas image and video data exhibit strong, domain-specific clustering based on high lift values. Consequently, we propose a dual-track strategy: enhancing web UX for individuals and API infrastructure for organizations, alongside purpose- driven data curation to optimize the AI ecosystem.
한국어
최근 초거대 AI의 부상으로 고품질 학습용 데이터의 중요성이 증대됨에 따라, 본 연구는 기존 설문조사 기반 연구의 한계를 넘어 대규모 로그 데이터를 활용해 AI 허브 이용자의 실제 데이터 소비 행태를 실증적으로 규명하고자 하였다. 이를 위해 2024년과 2025년의 이용 로그를 바탕으로 이용 그 룹별 방식 변화를 통계적으로 검증하고, 연관 규칙 및 사회 연결망 분석(SNA)을 통해 데이터 간의 구 조적 관계를 시각화하였다. 분석 결과, 개인 이용자는 웹 중심의 탐색을 유지하는 반면, 기업 및 기관 이용자는 API 기반의 자동화된 이용 방식으로 급격히 전환되고 있음이 확인되었다. 또한 데이터 소 비 패턴 분석 시, 텍스트 데이터는 네트워크 전반에 걸쳐 높은 연결 중심성을 가지며, 영상 및 이미지 데이터는 높은 향상도(Lift)를 기반으로 특정 도메인 내에서 강하게 결합된 형태의 소비 특성을 보였 다. 본 연구는 이러한 결과를 바탕으로 이용자 유형에 따른 이원화된 플랫폼 운영 정책과 데이터 특 성을 고려한 큐레이션 전략을 제안한다.
목차
Abstract
1. 서론
2. 이론적 배경
2.1. AI 허브와 학습용 데이터
2.2. 연관 규칙 분석
2.3. 소셜 네트워크 분석
3. 연구 설계
3.1. 분석 개요
3.2. 데이터 전처리
3.3. 분석 방법론
4. 연구 결과
4.1. 데이터 이용 방식의 변화
4.2. 이용자의 데이터 소비 패턴 분석
5. 결론
REFERENCES
