earticle

논문검색

DNN 을 리용한 조선어음성인식의 성능개선

원문정보

리은철

피인용수 : 0(자료제공 : 네이버학술정보)

초록

한국어

최근에 심층신경망(DNN)에 기초한 모형화방법이 급속히 발전하여 음성 인식성능이 크게 개선되고있다. 론문에서는 DNN 음향모형을 리용하여 조선어 열린어휘음성인식의 성능을 개선하는 방법을 서술하였다. 발성자독립 및 적응된 DNN 모형들을 훈련하는 방법을 주었으며 DNN 모형이 GMM 모형에 비하여 음소오유률(PER)을 30%정도 줄인다 는것을 보여주었다. 또한 음성인 식기《룡남산》에서 OOV 률이 다른 2 가지 시험자료에 대하여 DNN 모형의 성능 을 평가하였다. OOV 률이 낮은 자료에 대하여 글자오유률(CER)이 상대적 으로 74.4%정도, OOV 률이 높은 자료 에 대하여 39.4% 줄어들었다. 일부 응용들에서 숨은 층개수가 작은 모형들을 리용하는것이 리득일수 있으며 숨은 층개수가 많은 모형이 여러가지 변동에 더 로바스트적이라는것을 보여주었다. 저위수근사화와 공학적최량화에 의하여 모형크기와 사후확률평가시간이 15 배정도 단축되였다.

목차

초록
1. 서론
2. <룡남산> 기준음성인식체계
2.1 인식단위와 어휘사전
2.2 음향모형
2.3 언어모형
2.4 복호화
3. DNN에 기초한 모형화
3.1 훈련 및 시험을 위한 음성자료
3.2 DNN-HMM 모형훈련
3.3 모형크기축소와 복호화속도개선
4. 실험결과
4.1 GMM 과 DNN 모형의 성능비교
4.2 저위수근사화와 공학적최량화에 대한 평가
5. 결론
6. 앞으로의 연구방향
참고문헌

저자정보

  • 리은철 김일성종합대학 정보과학대학

참고문헌

자료제공 : 네이버학술정보

    함께 이용한 논문

      ※ 기관로그인 시 무료 이용이 가능합니다.

      • 4,000원

      0개의 논문이 장바구니에 담겼습니다.