earticle

논문검색

신호처리

음성인식 후처리에서 음소 유사율을 이용한 오류보정에 관한 연구

원문정보

A Study on Error Correction Using Phoneme Similarity in Post-Processing of Speech Recognition

한동조, 최기호

피인용수 : 0(자료제공 : 네이버학술정보)

초록

영어

Recently, systems based on speech recognition interface such as telematics terminals are being developed. However, many errors still exist in speech recognition and then studies about error correction are actively conducting. This paper proposes an error correction in post-processing of the speech recognition based on features of Korean phoneme. To support this algorithm, we used the phoneme similarity considering features of Korean phoneme. The phoneme similarity, which is utilized in this paper, rams data by mono-phoneme, and uses MFCC and LPC to extract feature in each Korean phoneme. In addition, the phoneme similarity uses a Bhattacharrya distance measure to get the similarity between one phoneme and the other. By using the phoneme similarity, the error of eo-jeol that may not be morphologically analyzed could be corrected. Also, the syllable recovery and morphological analysis are performed again. The results of the experiment show the improvement of 7.5% and 5.3% for each of MFCC and LPC.

한국어

최근 텔레매틱스 단말기 등과 같이 음성인식을 인터페이스로 하는 음성기반 검색시스템들이 많이 개발되고 있다. 그러나 음성인식에는 여전히 많은 오류가 존재하며, 이에 오류보정에 대한 여러 가지 연구가 진행되고 있다. 본 논문에서는 한국어의 음소가 갖는 특징을 기반으로 음성인식 후처리에서의 오류보정을 제안하였다. 이를 위해 한국어 음소의 특징을 고려한 음소 유사율을 사용하였다. 음소 유사율은 훈련데이터를 모노폰으로 훈련시켜 한국어 음소 각각에 대하여 MFCC와 LPC 특징추출방법을 사용하여 특징추출을 수행하고, 바타차랴 거리 측정법을 사용하여 각 음소 사이의 유사율을 구하였다. 음소 유사율과 신뢰도를 이용하여 오류보정률을 구하였으며, 이를 사용하여 음성인식 과정에서 오류로 판명된 어절에 대하여 오류보정을 수행하고, 음절 복원과 형태소 분석을 재수행하는 과정을 거쳤다. 실험 결과 MFCC와 LPC 각각 7.5%와 5.3%의 인식 향상률을 보였다.

목차

요약
 ABSTRACT
 I. 서론
 II. 음성 인식기
  1. 음절 복원
  2. 형태소 분석
 III. 음소 유사율을 이용한 오류보정
  1. 신뢰도
  2. MFCC(Mel Frequency Cepstrum Coefficient)
  3. 음소 유사율의 구성
  4. 오류보정 알고리즘
 IV. 구현 및 실험 결과 
  1. 구현
  2. 실험 결과
 V. 결론
 참고문헌

저자정보

  • 한동조 Dong-Jo Han. 광운대학교 컴퓨터공학과 박사과정
  • 최기호 Ki-Ho Choi. 광운대학교 컴퓨터공학과 교수

참고문헌

자료제공 : 네이버학술정보

    함께 이용한 논문

      ※ 기관로그인 시 무료 이용이 가능합니다.

      • 4,000원

      0개의 논문이 장바구니에 담겼습니다.