earticle

논문검색

딥러닝 기반의 Multi Scale Attention을 적용한 개선된 Pyramid Scene Parsing Network

원문정보

Modified Pyramid Scene Parsing Network with Deep Learning based Multi Scale Attention

김준혁, 이상훈, 한현호

피인용수 : 0(자료제공 : 네이버학술정보)

초록

영어

With the development of deep learning, semantic segmentation methods are being studied in various fields. There is a problem that segmenation accuracy drops in fields that require accuracy such as medical image analysis. In this paper, we improved PSPNet, which is a deep learning based segmentation method to minimized the loss of features during semantic segmentation. Conventional deep learning based segmentation methods result in lower resolution and loss of object features during feature extraction and compression. Due to these losses, the edge and the internal information of the object are lost, and there is a problem that the accuracy at the time of object segmentation is lowered. To solve these problems, we improved PSPNet, which is a semantic segmentation model. The multi-scale attention proposed to the conventional PSPNet was added to prevent feature loss of objects. The feature purification process was performed by applying the attention method to the conventional PPM module. By suppressing unnecessary feature information, eadg and texture information was improved. The proposed method trained on the Cityscapes dataset and use the segmentation index MIoU for quantitative evaluation. As a result of the experiment, the segmentation accuracy was improved by about 1.5% compared to the conventional PSPNet.

한국어

딥러닝의 발전으로 인하여 의미론적 분할 방법은 다양한 분야에서 연구되고 있다. 의료 영상 분석과 같이 정확성을 요구하는 분야에서 분할 정확도가 떨어지는 문제가 있다. 본 논문은 의미론적 분할 시 특징 손실을 최소화하기 위해 딥러닝 기반 분할 방법인 PSPNet을 개선하였다. 기존 딥러닝 기반의 분할 방법은 특징 추출 및 압축 과정에서 해상도가 낮아져 객체에 대한 특징 손실이 발생한다. 이러한 손실로 윤곽선이나 객체 내부 정보에 손실이 발생하여 객체 분류 시 정확도가 낮아지는 문제가 있다. 이러한 문제를 해결하기 위해 의미론적 분할 모델인 PSPNet을 개선하였다. 기존 PSPNet에 제안하 는 multi scale attention을 추가하여 객체의 특징 손실을 방지하였다. 기존 PPM 모듈에 attention 방법을 적용하여 특징 정제 과정을 수행하였다. 불필요한 특징 정보를 억제함으로써 윤곽선 및 질감 정보가 개선되었다. 제안하는 방법은 Cityscapes 데이터 셋으로 학습하였으며, 정량적 평가를 위해 분할 지표인 MIoU를 사용하였다. 실험을 통해 기존 PSPNet 대비 분할 정확도가 약 1.5% 향상되었다.

목차

요약
Abstract
1. 서론
2. 관련 연구
2.1 PSPNet(Pyramid Scene Parsing Network)
2.2 CBAM(Convolutional Block Attention Module)
3. 제안하는 방법
3.1 Multi Scale Attention
3.2 Modified Pyramid Pooling Moudule
3.3 Loss Function
4. 실험 결과 및 고찰
4.1 Cityscapes
4.2 Attention Ablation Study
5. 결론
REFERENCES

저자정보

  • 김준혁 Jun-Hyeok Kim. 광운대학교 플라즈마바이오디스플레이학과 석사과정
  • 이상훈 Sang-Hun Lee. 광운대학교 인제니움학부 교수
  • 한현호 Hyun-Ho Han. 울산대학교 교양대학 교수

참고문헌

자료제공 : 네이버학술정보

    함께 이용한 논문

      ※ 기관로그인 시 무료 이용이 가능합니다.

      • 4,000원

      0개의 논문이 장바구니에 담겼습니다.