DNN을 위한 비트 단위 파라미터 조작 프레임워크 및 파라미터와 정확도 간의 상호 연관성 분석

이동인; 김정헌; 임승호

DNN을 위한 비트 단위 파라미터 조작 프레임워크 및 파라미터와 정확도 간의 상호 연관성 분석

원문정보

Bit-level Parameter Manipulation Framework for DNNs and Analysis of Mutual Relationship Between Parameters and Accuracy

이동인, 김정헌, 임승호

한국차세대컴퓨팅학회 한국차세대컴퓨팅학회 논문지 Vol.20 No.3 2024.06 pp.36-46 KCI 등재

피인용수 : 0건 (자료제공 : 네이버학술정보)

초록

영어

Recently, with the proliferation of DNNs in various industries, there has been a surge in research on lightweight models suitable for IoT devices and edge computing. In this paper, we propose an automated framework that enables manipulation of deep learning model parameters at a 1-bit level, a capability not previously available. We investigate the relationship between parameter bits and model accuracy. Using the developed framework, we systematically experimented with the parameters of CNN models pre-trained on the ImageNet dataset by setting the lower n-bit to 0, 1, or a random value while each method inducing distinct information loss. The primary models evaluated include InceptionV3, InceptionResnetV2, ResNet50, Xception, DenseNet121, MobileNetV1, and MobileNetV2. Experimental results show that models with lower performance are more sensitive to information loss in the lower bits, requiring fewer bits to maintain accuracy compared to high-performing models. This concludes a high robustness between parameters and accuracy.

한국어

최근 DNN이 다양한 산업에 확산되면서 IoT 기기 및 엣지 컴퓨팅에 적합한 경량 모델에 관한 연구가 급증하고 있 다. 본 논문에서는 기존에 없던 딥러닝 모델의 파라미터를 1 비트 단위로 조작할 수 있는 자동화 프레임워크를 개발 하며 파라미터 비트와 모델 정확도 사이의 관계를 실험 및 연구한다. 본 연구는 제안된 프레임워크를 사용하여 ImageNet 데이터셋으로 사전 학습된 DNN 모델 중 CNN 모델들의 파라미터를 하위 n-bit를 0, 1 또는 랜덤한 값으로 치환하는 3가지 방법을 통해 각각 정보 손실 발생시키면서 파라미터와 정확도 간의 강인성을 비트 단위로 실험하였다. 주요 모델로는 InceptionV3, InceptionResnetV2, ResNet50, Xception, DenseNet121, Mobile NetV1, MobileNetV2 을 사용하였다. 실험 결과, 성능이 낮은 모델일수록 하위 비트의 정보 손실에 민감하여 성 능이 좋은 모델보다 정확도를 유지하는 비트 수가 적다는 것을 실험적으로 확인했고, 파라미터와 정확도 간의 강인 성이 높다는 것을 확인하였다. 이러한 실험을 바탕으로 모델별 유효 파라미터 비트를 설정하여 파라미터를 줄이며 정확도를 유지할 수 있다.

요약
Abstract
1. 서론
2. 관련연구
2.1 DNN 모델 경량화 기법 개요
2.2 ImageNet 데이터셋과 다양한 DNN 모델
3. 프레임워크 설계 및 구현 내용
3.1 전체 구조 및 구성 Overview
3.2 인터페이스 및 연산 구현
3.3 딥러닝 모델에 적용 방법
4. 실험 및 실험 결과
5. 결론 및 향후 과제
Acknowledgement
참고문헌

키워드

저자정보

이동인 Dong-In Lee. 한국외국어대학교 컴퓨터공학부
김정헌 Jung-Heon Kim. 한국외국어대학교 정보통신공학과
임승호 Seung-Ho Lim. 한국외국어대학교 컴퓨터공학부

참고문헌

자료제공 : 네이버학술정보

함께 이용한 논문

0개의 논문이 장바구니에 담겼습니다.

earticle