원문정보
초록
한국어
본 연구는 글로벌 음악 시장에서 주요 스트리밍 플랫폼인 Spotify의 일간 순위를 예측하는 모델을 구축하는 데 초점을 맞추고 있다. 최근 몇 년간 스트리밍 서비스의 급격한 확산으로 인해 음악 산업은 큰 변화를 겪고 있으며, 2023년 국제 음반 산업 연맹(IFPI)의 보고서에 따르면 음반 시장의 매출은 전년 대비 10.2% 증가한 286억 달러에 달한다. 스트리밍은 이제 음악 소비의 핵심 채널로 자리 잡았으며 특히 유료 스트리밍 서비스 구독자 수가 6억 6,700만 명 이상으로 증가하면서 Spotify와 같은 플랫폼에서 데이터를 분석하는 것은 음악 산업 내 마케팅 전략 수립에 매우 중요한 역할을 하고 있다. 이전 연구들은 주로 음반 자체의 특성에 집중하여 곡의 성공 여부를 예측하거나 시간에 따른 특성 변화를 살펴보는 데 그쳤다. 그러나 음반의 인기는 단순히 음악의 특성만으로 결정되는 것이 아니라 소비자의 실시간 반응, 소셜 미디어 상의 반응, 그리고 마케팅 활동에 의해 복합적으로 형성된다. 본 연구는 음반의 특성 뿐 아니라 유튜브와 같은 소셜 미디어 플랫폼의 사용자 행동 데이터를 분석하여 이러한 외부 반응이 Spotify의 인기 순위에 미치는 영향을 예측하는 모델을 제안한다. 본 연구에서는 K-POP 음반을 대상으로 2023년 11월부터 2024년 4월까지의 데이터를 활용하여 예측 모델을 개발하였다. 특히 Firm Generated Content(FGC)와 User Generated Content(UGC)에 대한 소비자 참여 데이터(조회수, 좋아요 수, 댓글 수 등)의 변화를 분석에 포함시켰으며 실시간으로 변화하는 사용자 반응이 음원의 인기도에 어떤 영향을 미치는지를 중점적으로 다루었다. 유튜브 조회수, 댓글, 좋아요 등의 데이터는 소비자의 감정과 트렌드를 반영하며, 이는 음원의 인기도 변동을 더 정교하게 예측할 수 있는 중요한 변수로 작용한다. 연구의 주요 성과로는 다양한 머신러닝 및 딥러닝 모델을 비교 분석하여 랜덤 포레스트(Random Forest)와 XGBoost와 같은 비선형 모델이 뛰어난 예측 성능을 보였다는 점이다. 랜덤 포레스트 모델은 가장 낮은 평균 제곱 오차(Mean Squared Error, MSE)인 0.739를 기록하며 가장 우수한 성과를 보였고, LightGBM 모델도 1.754로 안정적인 성능을 보였다. 반면, 기존에 많이 사용되던 LSTM(Long Short-Term Memory)모델은 시계열 데이터를 처리하는 데 적합하다는 이론적 배경에도 불구하고 2405.540이라는 MSE를 기록하며 상대적으로 낮은 성능을 보였다. 이는 복잡한 시계열 데이터를 학습하는 LSTM 모델이 다른 머신러닝 모델에 비해 더 많은 데이터를 요구하며 시퀀스 길이 조정 및 파라미터 튜닝이 필요하다는 점을 시사한다. 본 연구의 결과는 음악 산업 마케팅 담당자에게 실질적인 인사이트를 제공할 수 있다. 특히 랜덤 포레스트와 XGBoost 모델은 실시간으로 변동하는 사용자 반응을 바탕으로 음원의 인기도 변화를 보다 정확하게 예측할 수 있으며, 이를 통해 마케팅 전략을 신속하게 수정하거나 강화할 수 있다. 예를 들어, 특정 음반의 순위 하락이 예상될 경우 소셜 미디어에서 팬 참여를 유도하는 캠페인을 기획하여 순위 반등을 도모할 수 있을 것이다. 결론적으로 본 연구는 소셜 미디어 데이터를 활용하여 음원의 인기도를 예측하는 데 있어 머신러닝 및 딥러닝 모델의 성능을 비교 분석하였으며, 이를 통해 음악 산업의 마케팅 전략 수립에 중요한 기여를 할 수 있음을 보여준다. 소셜 미디어 반응이 음원의 성과에 미치는 영향을 정량적으로 분석함으로써 디지털 마케팅 전략에 새로운 인사이트를 제공하며, 이를 통해 음악 콘텐츠와 소비자 간의 상호작용을 심층적으로 이해할 수 있는 계기를 마련하였다.
