earticle

논문검색

Oral Session Ⅱ 의료, 멀티미디어 콘텐츠

착용형 청각기기 적용을 위한 음성 향상 신경망 연구

원문정보

Research on speech enhancing neural network applied to wearable hearing devices

김선만, 박주영

피인용수 : 0(자료제공 : 네이버학술정보)

초록

한국어

본 논문에서는 웨어러블 청각 기기에 적용되는 음성 향상 심층 신경망을 제안한다. 먼저 청각 기기 요구 사항에 따라 총 알고리즘 처리 지연이 8ms인 32채널 청각 필터뱅크를 구현하였다. 제안 방법의 핵심은 필터뱅크 기반이 되는 균일 다상 이산 푸리에 변환 구조에 디노이징 신경망을 구현하여 대역별 음성 향상을 이루는 것이다. 특히 각 대역의 음성 스펙트럼 위상 정보를 복원하기 위해 복소수 컨볼루션 신경망을 도입하였다. 다음으로, 청각 필터뱅크 음성 디노이징 신경망을 학습시키기 위해 각 대역의 복소수 시간 영역에서 잡음 음성신호와 깨끗한 음성신호 간의 매칭을 통한 손실 함수를 계산하였다. 제안된 청각 필터뱅크 음성 디노이징 신경망의 성능은 음성대 신호 잡음비가 -10 ~ 15dB 범위의 6가지 잡음 조건에서 객관적인 음성 인지도 및 음질 점수 측정을 통해 평가되었으며, 결과적으로, 제안 방법이 기존 방법보다 높은 인지도 와 음질 지수를 보여주었다.

목차

요약
1. 서론
2. 제안 청각기기 음성 디노이징 모델
3. 실험 결과 및 고찰
4. 결론
Acknowledgement
참고문헌

저자정보

  • 김선만 공간광정보연구센터 한국광기술원
  • 박주영 공간광정보연구센터 한국광기술원

참고문헌

자료제공 : 네이버학술정보

    함께 이용한 논문

      0개의 논문이 장바구니에 담겼습니다.