earticle

논문검색

논문

워프 스케쥴링 기법에 따른 GPU 성능 분석

원문정보

Analysis of GPU Performance Depending on Warp Scheduling Schemes

최홍준, 김철홍, 김종면

피인용수 : 0(자료제공 : 네이버학술정보)

초록

영어

Shader core can process multiple warps simultaneously, enabling the GPU to improve the utilization of computational resources. The performance of the shader core depends on the warp scheduling schemes which select the warp to execute among assigned multiple warps. Therefore, we analyze the GPU performance according to three warp scheduling schemes in this work: random scheduling, round robin scheduling, and first ready first come first service scheduling schemes. Experimental results show that the performance gap between simulated warp scheduling schemes is negligible when the applications without branch instructions are executed, while the performance gap increases when the applications including lots of branch instructions are executed. The performance gap is caused by branch instructions which have strong relation to memory bottleneck depending on the warp scheduling schemes.

한국어

GPU에서 실제 연산을 담당하는 세이더코어는 다수의 워프를 동시에 할당받아 수행함으로써 연산자원 활용률을 극 대화한다. 세이더코어가 할당받은 다수의 워프들 중에서 어떠한 워프를 선택하여 수행하는지에 따라 GPU의 성능 은 달라질 것으로 예상된다. 효율적인 워프 스케쥴링 기법을 개발하기 위해서는 워프 스케쥴링 기법의 특성 분석이 선행되어야 한다. 본 논문에서는 워프 스케쥴링 기법에 따른 GPU의 성능을 분석하고자 한다. 무작위 스케쥴링, 라 운드로빈 스케쥴링, 그리고 선입선처리 스케쥴링 기법을 분석 대상으로 사용한다. 실험 결과에 따르면, 분기 명령어 를 포함하지 않는 응용프로그램을 수행하는 경우에는 스케쥴링 기법에 따른 성능 차이가 거의 없는 반면에, 분기 명 령어를 다수 포함하는 응용프로그램을 수행하는 경우에는 스케쥴링 기법에 따른 성능 차이가 상당히 발생함을 알 수 있다. 그 이유는 분기 명령어는 워프 스케쥴링 기법에 따라 무작위적인 메모리 접근으로 유발되는 병목현상을 완화 또는 악화시키기기 때문으로 분석된다. 본 논문의 분석 결과는 범용 응용프로그램을 수행하는 GPU를 위한 워프 스 케쥴링 기법을 개발하고자 하는 경우 가이드라인을 제시할 수 있을 것으로 기대된다.

목차

요약
 Abstract
 1. 서론
 2. GPU 구조
  2.1 파이프라인
  2.2 세이더코어 구조
 3. 워프
  3.1 워프 생성 기법
  3.2 워프 스케쥴링
 4. 실험 환경 및 결과 분석
  4.1 실험 환경
  4.2 실험 결과
 5. 결론
 감사의 글
 참고문헌

저자정보

  • 최홍준 Hong Jun Choi. 전남대학교 전자컴퓨터공학부
  • 김종면 Jong Myon Kim. 울산대학교 전기공학부
  • 김철홍 Cheol Hong Kim. 전남대학교 전자컴퓨터공학부

참고문헌

자료제공 : 네이버학술정보

    함께 이용한 논문

      0개의 논문이 장바구니에 담겼습니다.