earticle

논문검색

전화망 음성 데이터를 이용한 향상된 음성 특징 추출 방법

원문정보

Improvement Speech Feature Extraction Method Using Telephone Speech Data

이철희

피인용수 : 0(자료제공 : 네이버학술정보)

초록

영어

In this paper, we study a method extracting the speech feature parameter in many methods for improving the speech recognition rate. MFCC(Mel Frequency Cepstral Coefficient) based on the auditory characteristic and GFCC(Gammatone filter Frequency Cepstrum Coefficient) for improving performance of MFCC are suggested and telephone speech recognition also. Feature parameter is extracted with gammatone bandpass filter depicted basilar membrane characteristic of auditory structure instead of triangular filter generally used for critical bandwidth filter in MFCC. In experiments, we compared LPCC and MFCC. CMS(Cepstral Mean Subtraction) is used for compensating channel distortion in telephone and shows improvement in recognition.

한국어

본 논문은 음성 인식률 향상을 위한 여러 가지 방법들 중에서 음성특징 파라미터 추출 방법에 관한 한 가지 방법을 제시하였다. 본 논문에서는 청각 특성을 기반으로 한 MFCC(mel frequency cepstrum coefficients)와 성능 향상 을 위한 방법으로 GFCC (gammatone filter frequency cepstrum coefficients)를 제시하고 음성 인식을 수행하여 성능을 비교하였다. MFCC에서 일반적으로 사용하는 임계 대역 필터로 삼각 필터(triangular filter) 대신 청각 구조의 기저막 (basilar membrane)특성을 묘사한 gammatone 대역 통과 필터를 이용하여 특징 파라미터를 추출하였다. 인식 알고리즘 으로 사용하여 LPCC(linear prediction cepstrum coefficient), MFCC와 GFCC의 각 인식 성능을 비교하였다.

목차

요약
Abstract
Ⅰ. 서론
Ⅱ. 본론
2.1 전화망 채널 보상 방법
2.2 CMS(Cepstral Mean Subtraction)
2.3 기저막 특성의 대역 통과 필터
2.4 기저막 특성을 이용한 파라미터 추출
Ⅲ. 실험 및 결과
Ⅳ. 결론
REFERENCES

저자정보

  • 이철희 Chul-Hee Lee. ILS Co., Ltd. 연구소장

참고문헌

자료제공 : 네이버학술정보

    함께 이용한 논문

      ※ 기관로그인 시 무료 이용이 가능합니다.
      ※ 학술발표대회집, 워크숍 자료집 중 4페이지 이내 논문은 '요약'만 제공되는 경우가 있으니, 구매 전에 간행물명, 페이지 수 확인 부탁 드립니다.

      • 4,000원

      0개의 논문이 장바구니에 담겼습니다.