earticle

논문검색

Session III : 인공지능 및 기계학습

음성언어 감정 인식을 위한 시계열 특징추출 및 다양한 순환신경망 모델의 성능비교

원문정보

Time Series Feature Extraction and Performance Comparison of Recurrent Neural Network Models for Speech Emotion Recognition

민동진, 원종호, 강동현, 김덕환

피인용수 : 0(자료제공 : 네이버학술정보)

초록

한국어

인간의 주 의사 소통 방법인 목소리를 통한 음성 언어는 단순한 언어 정보의 전달만이 아니라 음성의 억양과 높낮이 그리고 주변 환경 등 여러가지 특징을 통해 감정 정보를 함께 전달하게 된다. 현재 많은 연구들이 인간과 컴퓨터의 상호작용을 위해 음성언어기반의 감정을 시스템이 파악하는데 초점을 맞추고 있으며, 음성의 다양한 주파수 특성을 추출하여 신경망모델을 개발하고 있다. 본 논문은 시간에 따른 감정 변화를 정확하게 인식하기 위해, 시간 영역에서 시계열 데이터 전처리와 3 가지 음성 신호 기반의 자연어 특징 추출을 진행한다. 제안하는 데이터 전처리, 특징 추출 방법은 주파수 영역의 특징으로만 비교하는 학습 방식보다 시간에 따라 변화하는 자연어 및 복잡한 감정인식에 유리하다. 2개의 공개 데이터 셋을 이용하여 시계열 특징을 입력으로 하는 순환 신경망 모델 알고리즘들을 개발하고 이들의 성능을 비교하였다.

목차

요약
1. 서론
2. 관련연구
3. 제안한 방법
3.1. 데이터 전처리
3.2. 시계열 음성 특징 추출
3.4. 순환 신경망 모델 알고리즘
4. 실험결과
5. 결론
참고문헌

저자정보

  • 민동진 인하대학교 전기컴퓨터공학과
  • 원종호 인하대학교 전기컴퓨터공학과
  • 강동현 인하대학교 전기컴퓨터공학과
  • 김덕환 인하대학교 전기컴퓨터공학과

참고문헌

자료제공 : 네이버학술정보

    함께 이용한 논문

      0개의 논문이 장바구니에 담겼습니다.