earticle

논문검색

세션 II: MR-IoT융합 인공지능 기술

Edge AI 의 추론 과정을 위한 계층적 작업 분할 배치 기법

원문정보

Hierarchical Job Placement Method for Inference Process of Edge AI

이승준, 여상호, 오상윤

피인용수 : 0(자료제공 : 네이버학술정보)

초록

한국어

머신러닝 모델을 엣지 디바이스에 안정적으로 배포하기 위해서 기존 클라우드 기반의 머신 러닝 모델 배포는 높은 지연 시간으로 인해 머신 러닝 서비스의 질을 떨어트리는 문제를 야기한다. 또한, 추론을 위한 입력 데이터의 전송 과정은 개인 정보의 유출을 야기한다. 이러한 문제를 해결하기 위해서 개인 정보 유출 및 통신 부하 문제를 해결할 수 있는 엣지 서버 및 엣지 디바이스를 활용한 추론 과정의 정의가 요구된다. 본 연구팀은 효과적인 추론 과정의 정의를 위해 기존 분산 딥러닝의 모델 및 데이터 병렬화 파이프라인 기법에 기반하는 단일 추론 모델에 대한 엣지 서버-디바이스 간 모델 분할 기법 및 엣지에서 요청되는 독립된 다중 작업들에 대한 효과적인 스케쥴링 기법을 제안한다.

목차

Abstract
1. 서론
2. 배경
2.1 Edge AI
2.2 분산딥러닝 파이프라인 기술
3. 효율적인 Edge AI를 위한 엣지 디바이스 및 엣지 서버 간의 효과적인 추론작업 배치 기법
3.1 모델 병렬화 파이프라인 기법 기반의 엣지 서버-디바이스 간 모델 배치 기법
3.2 효과적인 엣지 자원활용을 위한 추론 작업의 중첩
4. 결론 및 향후 계획
Acknowledgement
References

저자정보

  • 이승준 인공지능학과 아주대학교 수원, 대한민국
  • 여상호 인공지능학과 아주대학교 수원, 대한민국
  • 오상윤 소프트웨어학과 아주대학교 수원, 대한민국

0개의 논문이 장바구니에 담겼습니다.