착용형 청각기기 적용을 위한 음성 향상 신경망 연구

김선만; 박주영

Oral Session Ⅱ 의료, 멀티미디어 콘텐츠

착용형 청각기기 적용을 위한 음성 향상 신경망 연구

원문정보

Research on speech enhancing neural network applied to wearable hearing devices

김선만, 박주영

한국차세대컴퓨팅학회 한국차세대컴퓨팅학회 학술대회 2024 한국차세대컴퓨팅학회 춘계학술대회 2024.04 pp.90-91

피인용수 : 0건 (자료제공 : 네이버학술정보)

초록

한국어

본 논문에서는 웨어러블 청각 기기에 적용되는 음성 향상 심층 신경망을 제안한다. 먼저 청각 기기 요구 사항에 따라 총 알고리즘 처리 지연이 8ms인 32채널 청각 필터뱅크를 구현하였다. 제안 방법의 핵심은 필터뱅크 기반이 되는 균일 다상 이산 푸리에 변환 구조에 디노이징 신경망을 구현하여 대역별 음성 향상을 이루는 것이다. 특히 각 대역의 음성 스펙트럼 위상 정보를 복원하기 위해 복소수 컨볼루션 신경망을 도입하였다. 다음으로, 청각 필터뱅크 음성 디노이징 신경망을 학습시키기 위해 각 대역의 복소수 시간 영역에서 잡음 음성신호와 깨끗한 음성신호 간의 매칭을 통한 손실 함수를 계산하였다. 제안된 청각 필터뱅크 음성 디노이징 신경망의 성능은 음성대 신호 잡음비가 -10 ~ 15dB 범위의 6가지 잡음 조건에서 객관적인 음성 인지도 및 음질 점수 측정을 통해 평가되었으며, 결과적으로, 제안 방법이 기존 방법보다 높은 인지도 와 음질 지수를 보여주었다.

키워드

저자정보

김선만 공간광정보연구센터 한국광기술원
박주영 공간광정보연구센터 한국광기술원

참고문헌

자료제공 : 네이버학술정보

함께 이용한 논문

0개의 논문이 장바구니에 담겼습니다.

earticle

착용형 청각기기 적용을 위한 음성 향상 신경망 연구

원문정보

초록

목차

키워드

저자정보

참고문헌

함께 이용한 논문