원문정보
Implementation and Performance Analysis of Fuzzy C-Means Algorithm Using GPGPU
초록
영어
Image segmentation plays a crucial role in numerous biomedical imaging applications. However, its high computational complexities require substantial amount of time and have limited its use in real applications. With this reason, this paper implements a fuzzy c-means (FCM) clustering algorithm on general purpose graphics processing unit (GPGPU) in order to run it in real time. This paper first reconfigures a target medical image for real-time processing of FCM, and calculates optimal sizes of threads and blocks for FCM based on the number of registers required by a shader core. To evaluate the proposed approach on GPGPU, this paper measures execution times to complete FCM on GPGPU by utilizing medical images at different resolutions (64×64, 128×128, 256×256, 512×512, 1,024×1,024). Experimental results indicate that execution times on GPGPU are approximately 4-fold faster than those on a single CPU for all of medical images except an 64×64 medical image.
한국어
영상 분할은 의료 영상 처리에서 중요한 역할을 수행하지만 영상 분할 알고리즘의 많은 연 산량은 실생활에서의 사용 을 제약하는 요인이 된다. 따라서 본 논문에서는 본 논문에서는 고해상도 의료 영상 분할 알 고리즘의 실시간 처리를 위해 GPGPU(general purpose graphics processing unit)상에서 영상 분할 알고리즘인 Fuzzy C-Means (FCM)의 병렬구현 방법을 제안한다. 본 논문에서는 GPU상에서 FCM 알고리즘의 고속화를 위해 대상 영상을 재 구성하고, 단일 쉐이더 코어에서 필요한 레지스터 개수를 바탕으로 FCM 알고리즘을 위한 최적의 쓰레드(thread) 와 블록(block)의 크기를 계산한다. 성능 평가를 위해 본 논문에서는 총 5가지 크기의 의료 영상(64×64, 128×128, 256×256, 512×512, 1,024×1,024)을 이용하여 단일 CPU대비 향상된 실행 시간을 측정하였고, 모 의실험 결과 64x64 영상을 제외한 나머지 영상에서 단일 CPU 보다 약 4배 높은 실행 시간 의 향상을 나타내었다.
목차
Abstract
1. 서론
2. 관련 연구
2.1 Fuzzy C-Means 알고리즘
2.2 GPGPU
2.3 CUDA
3. GPGPU 기반 FCM 알고리즘의 병렬 구현
3.1 FCM 알고리즘의 병렬 구현
3.2 GPU 메모리 접근 및 쓰레드 할당
4. 실험 결과
4.1 실험 환경
4.2 결과 및 분석
5. 결론
감사의 글
참고문헌
