earticle

논문검색

Session 5 컴퓨터비전

투사적 그림검사 분야로의 트랜스포머 기반의 이미지 분류 모델 적용에 관한 연구

원문정보

A Study on the Application of Transformer-Based Image Classification Model for Projective Drawing Test

Hoyoung Choi, Seungwan Jin, Kyungsik Han

피인용수 : 0(자료제공 : 네이버학술정보)

초록

한국어

본 논문에서는 심리진단을 위한 그림검사(Drawing Test) 과정에서 미술치료사의 객관적인 의사결정을 지원하기 위한 이미지 분류 모델인 VQ-ViT(Vector Quantization-Vision Transformer)을 제안한다. 사전학습을 위해 대규모의 레이블링 데이터셋이 필요한 기존의 이미지 분류 모델(e.g., Resnet, Vision Transformer)에 비해 VQ-ViT는 레이블링되지 않은 데이터에 대하여 비지도학습으로 임베딩을 진행한다. 우리는 CIFAR-10, TU-Berlin 그리고 직접 수집한 빗 속의 사람 그림 검사(PITR, Person-In-The-Rain) 데이터셋에 대하여 VQ-ViT와 기존의 이미지 분류 모델들과의 성능 비교실험을 진행하였다. 그 결과 VQ-ViT는 비지도 학습의 이미지 임베딩 기법과 적은 파라미터 수로 그림검사 분야에서의 발전 가능성을 보였다. 이를 기반으로 우리는 딥러닝 기반의 이미지 분류 모델의 한계점 파악 및 발전 방향을 논의한다.

목차

Abstract
1. Introduction
2. Related Work
2.1. PITR (Person-In-The-Rain) 검사
2.2. Image Classification
3. Methods
3.1. Dataset
3.2. VQ-ViT
4. Experiments
4.1. Experimental setup
4.2. Experimental results
5. Conclusions
Acknowledgement
References

저자정보

  • Hoyoung Choi Department of Software Engineering Ajou University Suwon, Korea
  • Seungwan Jin Department of Artificial Intelligence Ajou Univeristy Suwon, Korea
  • Kyungsik Han Department of Artificial Intelligence Ajou Univeristy Suwon, Korea

참고문헌

자료제공 : 네이버학술정보

    함께 이용한 논문

      0개의 논문이 장바구니에 담겼습니다.