원문정보
Object detection based on the deep learning method in a person in the rain image
초록
영어
Person in the rain (PITR) is an art therapy assessment method that reflects both stress and coping behaviors. According to Lack's PITR scoring criteria, 16 items such as rain and puddles are classified as stressors, and 19 items such as umbrellas and raincoats are classified as coping resources. This study used PITR for object detection with a total of 700 images of the dataset consisting of 560 images for training, 30 for validation, and 110 for testing. The object detection model suggested here adopts a one-stage object detection architecture called Dynamic Head (i.e., Dyhead). After pre-training the model on a large computer vision benchmark dataset (MS COCO 2017) for 24 epochs, it was fine-tuned for another 36 epochs using the PITR dataset, with a mean average precision of 62.7 on the validation set and 49.4 on the test set. The proposed model can detect key objects such as rain, person, and umbrella for the PITR test from various image styles.
한국어
본 연구에서 객체 인식 과제의 대상으로 선정한 빗속의 사람 그림은 내담자의 스트레스와 스트레스 대처 행동을 반 영하는 검사이다. Lack의 빗속의 사람 그림 채점 기준에 따르면 비, 웅덩이 등 16개 항목은 스트레스 요인으로 분 류되고 우산, 우비 등 19개 항목은 대처 자원으로 분류된다. 본 연구에서는 총 700장의 빗속의 사람 그림 이미지 중 560장을 트레이닝 셋으로, 30장을 밸리데이션 셋으로, 110장을 테스트 셋으로 구성한 데이터셋으로 객체 인식 모델을 시도하였다. 모델은 one-stage detector인 Dynamic Head를 채택하여 대규모 컴퓨터 비전 벤치마크 데 이터셋 (MS COCO 2017)에서 24 에폭으로 사전 훈련을 진행하였고, 빗속의 사람 그림 데이터셋을 36 에폭으로 fine-tune하였다. 모델의 mean average precision은 밸리데이션 셋에서 62.7 이었고 테스트 셋에서는 49.4 이 었다. 본 연구에서 제안한 모델은 다양한 유형의 빗속의 사람 그림 평가에 참고가 되는 비, 사람, 우산 등의 주요 객체들을 인식할 수 있었다.
목차
Abstract
1. Introduction
2. Methods
2.1 Dataset
2.2 Model Architecture
2.3 Loss
2.4 Training Scheme
3. Results
4. Discussion
References