원문정보
Heterogeneous Parallel Programming based on the Performance of Shared Cache Memory
초록
영어
Heterogeneous processing systems are multi-processing environment containing heterogeneous CPU and GPU. They are widely used in a variety of areas that require fast computation speed. Recently, it is becoming possible to share address space and data through the integration of GPU and CPU. Furthermore, on-die integration of GPU architecture is developing as low power consumption, miniaturization and high performance are becoming more important. Operations in image processing such as filtering, interpolation, and histogram computation can efficiently use shared local memory and applying it to the on-die integration of GPU system in which CPU and GPU share the memory and address system can maximize the effect of those systems. We introduced the study of the effects of shared memory in the existing on-die integration of GPU system, we propose a method of efficient workload distribution between CPU and GPU by measuring the efficiency of cache sharing through image processing operations that use the shared local memory space.
한국어
이기종 처리환경은 이종의 CPU/GPU가 혼재하는 다처리 환경으로서 빠른 연산속도를 필요로 하는 다양한 응용 분야에서 리 사용되고 있다. 이러한 이기종 처리환경은 CPU/GPU/APU등 로세서를 통합리하여 데이터 공 유가 가능하며 력, 소형화, 고성능을 지향하는 계산 환경변화에 따라 이기종 처리 시스템은 지속으로 발하 고 있다. 여러 가지 응용분야 상처리는 이기종 환경에 가장 합하다. 필터링, 보간, 히스토그램 계산과 같은 상처리 련 연산은 공유 지역 메모리를 효율으로 사용할 수 있는 연산이므로 특별히 이기종 처리 시스템에서 효 과가 극화 된다. 본 논문에서는 이기종 처리 시스템에서의 공유 메모리가 가지는 효과를 소개하고 공유 메모리를 사용하는 상처리 기능을 통해 캐쉬 공유가 효율임을 보이고 이를 통해 CPU와 GPU간의 효율인 작업을 분배 방법을 제안한다.
목차
Abstract
1. 서론
2. 이기종 플랫폼에서의 병렬처리 프로그래밍
2.1. OpenCL
2.2. 메모리 구조를 이용한 GPU 프로그램의 최적화
2.3. 쓰레드 구조를 이용한 GPU프로그램의 최적화
2.4. 이기종 처리 환경에서의 프로그램 최적화
3. 공유 캐시 메모리에 기반한 효율적인 작업배분
3.1. 영상 필터링을 위한 OpenCL 커널설계
3.2 최적 작업배분량 계산
4. 실험 결과
5. 결론
참고문헌