원문정보
영역 기반 형상 기술자와 평균 이동 군집화를 이용한인간 형상 인식
초록
영어
This paper proposes a human shape recognition algorithm using the region-based shape descriptor and mean shift clustering. The main goal of paper is to identify that the object regions extracted in the video are human or not for video surveillance systems. The angular radial transform (ART), a region-based shape descriptor in MPEG-7, is applied to model the human shapes. We construct database images of human shapes, and exploit 3 radial and 12 angular frequencies for modeling human shapes. The 36-D ART vectors for human shapes are first clustered using mean shift clustering, and several representative ART vectors are modeled by mean vectors of clusters. The human objects are identified by distances between the representative vectors and ART vector of extracted object region. The distance threshold for each cluster is statistically obtained in the learning step. This paper also deals with smoothing object boundaries extracted by background subtraction, which improves the recognition rates. The ART vectors for human shapes are learned using thousands of illustration images and real objects extracted by background subtraction. Experiments are performed on various images such as MPEG CE-2-B data set, illustration of human and non-human objects, and video frames combined with background subtraction. The experimental results show that the proposed algorithm is robust and efficient in human object recognition.
한국어
본 논문은 영역 기반 형상 기술자와 평균 이동 군집화(mean-shift clustering)를 이용한 인간 형상 인식 방법을 제안한다. 영상 기반 감시 시스템에서 영상으로부터 검출된 객체 영역이 사람인지 아닌지를 판별하는 것이 본 논문의 주요 목적이다. 본 논문에서는 MPEG-7의 영역 기반 기술자인 angular radial transform (ART)을 인간 형상 모델링에 적용 하였다. 인간 형상의 이미지 데이터베이스를 구축하고, 인간 형상을 3 radial과 12 angular 주파수로 표현 하였다. 우선, 인간 형상의 36차원 ART 벡터를 평균 이동 군집화를 이용해서 군집화하고, 군집들의 평균 벡터를 이용해서 대표 ART 벡터들을 모델링 하였다. 객체 영역으로부터 추출된 ART 벡터와 대표 벡터들 사이의 거리를 통해서 인간 형상을 판별 한다. 각 군집의 거리 문턱값은 학습 과정에서 통계학적으로 결정 된다. 또한, 본 논문은 배경 제거를 통해 추출한 객체의 윤곽을 평활화함으로써 인식률을 증가시켰다. 인간 형상의 ART 벡터들을 훈련시키기 위하여, 수 천 개의 배경 제거를 통해 추출한 실제 객체들과 삽화를 이용하였다. MPEG CE-2-B 데이터 셋, 인간과 인간이 아닌 객체의 삽화, 그리고 배경 제거를 통해 얻은 영상과 같은 다양한 영상을 이용해서 실험들을 수행하였다. 제안하는 방법이 강인하고 효율적으로 인간 형상을 인식한다는 것을 실험 결과를 통해 증명 하였다.
목차
II. OVERVIEW OF ART
III. PROPOSED METHOD
IV. EXPERIMENTAL RESULTS
V. CONCLUSION
References
국문초록
Abstract