earticle

논문검색

DETR 기반의 객체 임베딩을 활용한 이미지 검색

원문정보

Image retrieval using DETR based object embedding

반충기, 박다영, 황영배, 이용, 장래영, 최명석

피인용수 : 0(자료제공 : 네이버학술정보)

초록

영어

Image retrieval is a problem of finding an image suitable for the purpose of search for a given image. Recent work utilizes a feature map of pre-trained deep learning models from large dataset for image classification to solve the content-based image retrival(CBIR) problem, mainly finding visually similar images. This paper proposes an object-based image retrival(OBIR) problem of finding an image containing an object same as a given image. Traditional image retrieval techniques use global or local features to search for similar images, which makes it difficult to obtain object information if a given image has a complex background or if the object of the image is small. To address this, we propose object embedding and image retrieval techniques using the latest object recognition models, DETR (Detection Transformer) and Bag of Visual Words (BoVW), which can represent object information regardless of background. This paper conduct a comparative experiment with existing image retrieval techniques using COCO data mainly used in object recognition problems and AID, Oxford & Paris data used in existing image retrieval techniques, and show that DETR-based BoVW outperforms existing methods in OBIR problems.

한국어

이미지 검색은 주어진 이미지에 대해 검색 목적에 맞는 이미지를 찾는 문제이다. 최근 연구는 주로 시각적으로 유사 한 이미지를 찾는 content-based image retrieval(CBIR) 문제를 해결하기 위해 이미지 분류를 위해 대용량 데 이터셋에 대해 사전 학습된 딥러닝 모델의 특징맵(feature map)을 활용한다. 본 논문은 주어진 이미지와 같은 객 체를 포함하고 있는 이미지를 찾는 object-based image retrieval(OBIR) 문제를 제안한다. 기존의 이미지 검색 기법은 global feature나 local feature를 사용해 유사한 이미지를 검색하는데 이때 주어진 이미지가 복잡한 배경 을 가지고 있거나 이미지의 객체가 작은 경우 객체 정보를 얻는 데 어려움이 발생한다. 이를 해결하기 위해 배경에 구애받지 않고 객체의 정보를 사용하는 최신 객체 인식 모델인 Detection Transformer(DETR)와 Bag of Visual Words(BoVW)를 활용한 객체 임베딩(object embedding) 및 이미지 검색 기법을 제안한다. 본 논문은 객체 인식 문제에 주로 쓰이는 COCO 데이터와 기존 이미지 검색 기법에서 사용하는 AID, Oxford & Paris 데이 터를 사용해 기존 이미지 검색 기법들과 비교 실험을 수행하였고, DETR 기반 BoVW가 OBIR 문제에서 기존 방법 대비 우수한 성능을 내는 것을 확인하였다.

목차

요약
Abstract
1. 서론
2. 배경지식
2.1 SIFT
2.2 BoVW
2.3 ResNet
2.4 DETR
3. 제안한 방법
4. 데이터셋
4.1 COCO
4.2 AID
4.3 Revisiting Oxford and Paris
5. 실험 결과
5.1 평가지표
5.2 COCO
5.3 AID
5.4 Paris & Oxford
6. 결론
참고문헌

저자정보

  • 반충기 Chung-gi Ban. 충북대학교 제어로봇공학전공
  • 박다영 Dayoung Park. 충북대학교 제어로봇공학전공
  • 황영배 Youngbae Hwang. 충북대학교 제어로봇공학전공
  • 이용 Ryong Lee. 한국과학기술정보연구원 기계학습데이터연구단
  • 장래영 Rae-young Jang. 한국과학기술정보연구원 기계학습데이터연구단
  • 최명석 Myung-Seok Choi. 한국과학기술정보연구원 기계학습데이터연구단

참고문헌

자료제공 : 네이버학술정보

    함께 이용한 논문

      0개의 논문이 장바구니에 담겼습니다.