원문정보
Hierarchical Information Learning Techniques for Cultural Heritage Data Classification
초록
영어
Recent techniques in image classification show strong performance on large, well-refined datasets, but are weak on long-tailed distributions. In addition, there is limited research on hierarchical datasets; however, hierarchical datasets organized in a tree-like structure can further exploit higher-level class information. In this paper, we collected a cultural heritage dataset to utilize hierarchical features, and found two causes of classification failure in the dataset. 1) misclassification due to class imbalance, and 2) superclass misclassification. To solve these problems, we propose a learning strategy utilizing two loss functions. We use a consistency loss function to take advantage of both sampling methods, uniform sampling and class-specific uniform sampling, and a loss function based on subclass prediction for the characteristics of the parent class. We achieve a performance improvement of 5.4% over baseline on a cultural heritage dataset using our proposed learning technique.
한국어
최근 이미지 분류 작업의 기술들은 잘 정제되어 있는 대규모 데이터 세트에서 강력한 성능을 보여주지만, 긴꼬리 분 포에서는 약한 모습을 보인다. 또한, 계층적 데이터 세트에 대한 연구는 제한적이다. 그러나 트리 형태의 구조로 조 직된 계층적 데이터 세트에서는 상위 클래스 정보를 추가적으로 활용할 수 있다. 본 논문에서는 계층적 특징 활용을 위해 문화유산 데이터 세트를 수집하였으며, 해당 데이터 세트에서 분류 실패의 두 가지 원인을 발견하였다. 1) 클 래스 불균형으로 인한 오 분류, 2) 상위 클래스 오 분류. 우리는 이러한 문제를 해결하기 위해 두 가지의 손실 함수 를 활용한 학습 전략을 제안한다. 유니폼 샘플링과 클래스별 유니폼 샘플링, 두 가지 샘플링 방법의 이점을 모두 가 져가기 위한 consistency 손실 함수와 상위 클래스의 특성을 위해 하위 클래스 예측에 기반한 손실 함수를 사용하 여 문화유산 데이터 세트에서 베이스라인 대비 5.4%의 성능 향상을 달성한다.
목차
Abstract
1. 서론
2. 관련 연구
2.1 계층적 이미지 분류 모델 및 방법
2.2 긴꼬리 분포의 문제점 해결을 위한 모델 및 방법
3. 제안 방법
3.1 계층적 문화제 데이터 세트 수집
3.2 긴꼬리 분포의 문제
3.3 계층적 데이터 활용의 부재로 인한 문제
3.4 긴꼬리 분포 및 계층적 데이터 학습 기법
4. 실험
4.1 실험 데이터
4.2 실험 세팅
4.3 실험 결과
5. 결론
Acknowledgement
참고문헌