원문정보
Robust Caption Segmentation Using DCT Coefficients and Edges
초록
영어
Utilizing captions is very important for effective video indexing and retrieval in digital video data. In this paper, we propose a method of robustly detecting captions using DCT(discrete cosine transform) coefficients and edges in input images. The suggested method first detects candidate caption regions by using horizontal and vertical high-frequency DCT coefficients. The method then obtains character regions containing captions from candidate regions through edge clustering. Subsequently, we separate captions from background in the obtained candidate region. Finally, we determine actual caption regions among candidate regions using an artificial neural network. Experimental results show that the proposed method can robustly extract caption regions from different input images.
한국어
디지털 비디오 데이터의 효과적인 색인과 검색을 위해서는 비디오 영상 안에 존재하는 자막을 활용하는 것이 매우 중요하다. 본 논문에서는 DCT(discrete cosine transform) 계수와 에지를 이용하여 입력 영상 안에 포함된 자막 을 강건하게 검출하는 방법을 제안한다. 제안된 방법에서는 먼저 입력 영상으로부터 자막이 존재할 것이라고 예상되 는 후보 자막 영역을 수평과 수직 방향의 고주파 특징을 이용하여 검출한다. 그런 다음, 후보 자막 영역에서 자막을 형성하는 영역들만을 에지의 군집화를 통해 추출한다. 그리고 앞에서 추출한 자막 영역에서 배경을 제외하고 문자만 을 추출한다. 마지막으로, 추출된 자막 영역이 비 자막 영역을 포함하지 않고 실제 자막 영역만을 포함하고 있는지 를 신경망을 이용하여 최종적으로 검증한다. 실험에서는 본 논문에서 제안한 자막 영역 검출 알고리즘이 서로 다른 상황에서 자막을 강건하게 추출한다는 것을 여러 가지의 실험을 통해 보여준다.
목차
Abstract
1. 서론
2. 관련 연구
3. 후보 자막 추출
4. 최종적인 자막 영역 분할
5. 실험 결과
6. 결론
Acknowledgement
참고문헌