


Statistical Spoken Language Understanding for Human-Computer Dialog System


정민우, 이근배

Spoken language understanding (SLU) addresses the problem of mapping natural language speech into semantic frame for structure encoding of its meaning. Most of the SLU systems separate out the dialog act (DA) identification from the named entity (NE) recognition to generate the semantic frames. In previous works, these two subtasks are treated by independent or cascaded approaches. In the cascaded systems, however, DA and NE influence only to one side, rather than to both sides. In this paper, we develop a new joint SLU model with a triangular-chain conditional random field (CRF) to encode inter-dependence between DA and NE. On four real dialog data, we show that our joint approach outperforms both independent and cascaded


음성 언어 이해는 자연어 음성으로부터 컴퓨터가 처리할 수 있는 형태의 의미를 저장하는 의미 구조를 추출하는 문제를 다룬다. 대부분의 음성 언어 이해 시스템들은 화행 분석과 개체명 분석을 구분하여 처리하고 있다. 기존 연구에서는 이러한 두 가지 문제를 독립적이거나 순차적인 방식으로 처리하고 있다. 하지만 순차적 시스템에서는 화행과 개체명이 한 방향으로만 영향을 주게 되는 단점이 존재한다. 본 논문에서는 화행과 개체명을 동시에 처리하기 위해 Triangular-chain CRF라는 새로운 결합 음성 언어 이해 모델을 제안한다. 음성 대화 데이터를 이용한 실험을 통해 제안하는 결합 모델이 독립 및 순차적 방법과 비교하여 성능이 향상됨을 제시한다.


 1. Introduction
 2. Motivation
 3. Method
  3.1 Triangular-chain Structure Model
  3.2 Joint Inference
 4. Experiment
  4.1 Data Sets and Setup
  4.2 Result
 5. Conclusion


  • 정민우 Minwoo Jeong. Department of Computer Science and Engineering, Pohang University of Science & Technology (POSTECH)
  • 이근배 Gary Geunbae Lee. Department of Computer Science and Engineering, Pohang University of Science & Technology (POSTECH)


