earticle

논문검색

09. 한국소통학회-한국음향학회 학술 교류 세션

칵테일 파티 효과 - 복수 화자의 검출 및 지역화 방법

원문정보

Cocktail Party Effect – Methods for Multi-Speaker Detection and Localization

이보원

피인용수 : 0(자료제공 : 네이버학술정보)

초록

한국어

칵테일 파티 효과란 복수의 화자가 존재하는 공간에서 그 화자들이 동시에 발화를 하는 경우에 인간의 청각 기관에는 모든 소리가 혼합되어 들리지만 인간은 자신이 집중하고자 하는 화자의 소리만을 들을 수 있는 능력을 의미한다. 이는 기계를 사용한 기술로는 구현하기 어려운 인간이 가지고 있는 특별한 능력이며 인간과 인간과의 소통, 더 나아가서는 인간의 탁월한 청각적 인지 능력에 대한 좋은 예가 된다. 컴퓨터 기술이 발전하면서 인간의 다양한 능력들을 기계를 사용하여 구현하고자 하는 많은 노력들이 있었으며 칵테일 파티 효과도 이러한 능력 중 하나의 예로 볼 수 있다. 이러한 기술이 기계로 구현하는 것이 가능해진다면 인간과 기계의 소통, 즉 음성인식 등의 기술이 보다 다양한 환경에서 구현이 가능하게 되며 더 나아가서는 인공지능 관련 기술들이 실생활에 범용적으로 사용이 가능하게 되는 등의 장점이 있다. 본 논문에서는 칵테일 파티 효과와 관련하여 지난 20여년간 개발되어 온 기술들에 대해서 서술하고자 한다. 또한 이러한 기술들을 바탕으로 인간의 소통에 관한 이해를 바탕으로 딥러닝 기술을 사용한 향후 기술발전 방향에 대한 전망도 제시한다.

목차

초록
 1. 서론
 2. 마이크 어레이 관련 기술
  2.1 마이크 어레이를 사용한 신호 추출
  2.2 복수 화자의 위치 검출
 3. 멀티 모드 센서 융합 기술
  3.1 시각적인 정보의 사용
  3.2 깊이 센서의 사용
  3.3. 멀티 모드 센서 융합
  3.4 복수 화자 검출 및 지역화 예시
 4. 결론 및 미래 전망
 참고문헌

저자정보

  • 이보원 인하대학교

참고문헌

자료제공 : 네이버학술정보

    함께 이용한 논문

      ※ 기관로그인 시 무료 이용이 가능합니다.

      • 4,200원

      0개의 논문이 장바구니에 담겼습니다.