earticle

논문검색

Implementation of a Voice Recognition System for Home Automation

원문정보

홈 오토메이션을 위한 음성 인식 시스템 구현

Jung Kyu Park, Eun Young Park

피인용수 : 0(자료제공 : 네이버학술정보)

초록

영어

Recently, voice recognition has been widely used for the stability of security systems. Voice recognition can be largely divided into speaker identification and authentication. Speaker identification is to recognize whose voice is among several people's voices, and speaker authentication is to authenticate whether the voice is a specific speaker's voice. Another criterion is whether or not the promised utterance is used, and it can be classified into sentence-dependent speaker recognition and sentence-independent speaker recognition. In this paper, Mel-Frequency Cepstral Coefficients (MFCC) are used to extract voice features, and Gaussian Mixture Modeling (GMM) model is used for voice feature modeling. In order to verify the speaker, the similarity of the input voice was determined. The system implemented in the study grants system access only to users whose voices have been verified. During the experiment, various types of background noises of 34 db or more were used, and in this situation, an accuracy of more than 70% was shown.

한국어

최근 보안 시스템의 안정성을 위해서 음성인식을 많이 활용하고 있다. 음성인식은 크게 화자의 식별과 인 증으로 구분할 수 있다. 화자의 식별은 여러 사람의 목소리 중에서 누구의 목소리 인지 인식하는 것이고, 화자 인 증은 목소리가 특정 화자의 목소리가 맞는지를 인증하는 것이다. 또 다른 기준으로 약속된 발화를 사용하는지 여 부에 따라 문장 종속 화자 인식과 문장 독립 화자 인식으로 분류할 수 있다. 본 논문에서는 음성의 특징 추출을 위해 Mel-Frequency Cepstral Coefficients(MFCC)를 사용하고 음성 특징 모델링을 위해 Gaussian Mixture Modeling(GMM) 모델을 사용한다. 화자를 검증하기 위해서 입력된 음성의 유사도를 판정하였다. 연구에서 구현 한 시스템은 음성이 검증된 사용자에 한해서 시스템 접근 권한을 부여할 수 있도록 하였다. 실험을 하는 동안 34db 이상의 다양한 유형의 배경 소음을 사용하였고 이 상황에서 70%의 이상의 정확도를 보였다.

목차

Abstract
요약
Ⅰ. Introduction
Ⅱ. Related Works
Ⅲ. Methodology
3.1 Pre-Processing
3.2 Mel-Frequency Cepstral Coeffient
3.3 Gaussian Mixture Model
3.4 Data Collection
Ⅳ. Implementaion
4.1 Voice data collection
4.2 Feature extraction
4.3 Training model
Ⅴ. Results
Ⅵ. Conclusion
REFERENCES

저자정보

  • Jung Kyu Park 박정규. Professor, Department of Computer Engineering, Daejin University
  • Eun Young Park 박은영. Professor, Rinascita College of Liberal Arts and Sciences, Shinhan University

참고문헌

자료제공 : 네이버학술정보

    함께 이용한 논문

      ※ 기관로그인 시 무료 이용이 가능합니다.

      • 4,000원

      0개의 논문이 장바구니에 담겼습니다.