원문정보
The Study on Speaker Change Verification Using SNR based weighted KL distance
초록
영어
In this paper, we have experimented to improve the verification performance of speaker change detection on broadcast news. It is to enhance the input noisy speech and to apply the KL distance Ds using the SNR-based weighting function wm. The basic experimental system is the verification system of speaker change using GMM-UBM based KL distance D(Experiment 0). Experiment 1 applies the input noisy speech enhancement using MMSE Log-STSA. Experiment 2 applies the new KL distance Ds to the system of Experiment 1. Experiments were conducted under the condition of 0% MDR in order to prevent missing information of speaker change. The FAR of Experiment 0 was 71.5%. The FAR of Experiment 1 was 67.3%, which was 4.2% higher than that of Experiment 0. The FAR of experiment 2 was 60.7%, which was 10.8% higher than that of experiment 0.
한국어
본 논문에서는 방송 뉴스에서 화자 변화 검증 성능 향상을 위해서 입력소음음성 향상과 SNR(Signal to Noise Ratio)기반 가중 함수 wm를 적용한 KL 거리 Ds를 실험하였다. GMM-UBM(Gaussian Mixture Model-Universal Background Model) 기반 KL(Kullback Leibler) 거리 D를 이용한 화자 변화 검증 시스템(실험 0)을 기본 시스템으로 한다. 실험 1은 실험 0의 입력소음음성 향상을 위해 MMSE Log-STSA(Minimum Mean Square Error Log-Spectral Amplitude Estimator)를 적용하였다. 실험 2는 실험 1의 기존 KL거리 D 대신에 Ds를 적용하였다. 실험 데이터베이 스는 다양한 소음을 반영하기 위해 스포츠 뉴스와 실외 인터뷰를 중심으로 구축하였다. 실험은 화자 변화 정보의 누락을 막기 위해 MDR(Missed Detection Rate) 0%를 기준으로 하였다. 실험 0은 FAR(False Alarm Rate) 71.5%의 성능을 보였다. 실험 1은 FAR 67.3%로 실험0에 비해 4.2% 향상되었고, 실험 2는 FAR 60.7%로 10.8% 향상되었다.
목차
Abstract
1. 서론
2. 소음음성의 향상
2.1 MMSE SATA
2.2 MMSE Log-STSA 추정기
2.3 결정지향 접근법을 활용한 ξk(n) 계산
3. Wm을 반영한 KL 거리 Ds
4. 실험결과
4.1 실험 데이터베이스
4.2 실험 시스템
4.3 실험 1. MMSE Log-STSA 기반 음성 향상
4.4 실험 2. Wm을 반영한 KL 거리 Ds 적용
5. 결론
ACKNOWLEDGMENTS
REFERENCES