원문정보
Real-Time Fire Detection Using K-means-Based FPGM Structural Pruning on YOLOv12
초록
영어
Real-time fire detection in edge-device environments requires high detection accuracy as well as efficient model operation under limited computational resources. However, the original YOLOv12- based object detection model has limitations for edge deployment due to its high computational complexity and model size. To address this issue, we propose an FPKM-based structural pruning method that combines K-means clustering with Filter Pruning via Geometric Median (FPGM), along with a reconstruction strategy to resolve channel mismatch problems caused by structural pruning. The reconstruction framework is designed to preserve tensor consistency and computational stability even in networks containing branching structures such as Residual, Concatenate, and Split connections. Experimental results show that the proposed FPKM method reduces both FLOPs and inference time across pruning ratios of 30%, 50%, and 70%, while maintaining only limited performance degradation. In the GPU (RTX 2080 Ti) environment, at a 50% pruning ratio, inference time was reduced from 4.4 ms to 2.6 ms (approximately 41% reduction), while mAP50 decreased from 79.5% to 77.3% (a 2.2% drop). In the CPU environment, the baseline model required 54.3 ms and 5.8 G FLOPs, whereas the 50% pruned model achieved 32.5 ms and 3.7 G FLOPs, demonstrating about 40% improvement in computational efficiency. These results confirm that the proposed method is effective not only in GPU environments but also in CPU-based edge scenarios, making it suitable for real-time fire detection on edge devices.
한국어
엣지 디바이스 환경에서 실시간 화재 탐지를 위해서는 높은 정확도와 함께 제한된 연산 자원 내에서의 효율적인 모 델 구동이 요구된다. 그러나 기존 YOLOv12 기반 객체 탐지 모델은 높은 연산량과 복잡도로 인해 엣지 환경 적용 에 제약이 있다. 이를 해결하기 위해 본 논문에서는 K-means clustering과 FPGM을 결합한 FPKM 기반 구조적 가지치기 방법을 제안하고, 구조적 가지치기 이후 발생할 수 있는 채널 불일치 문제를 해결하기 위한 모델 재구성 전략을 함께 적용하였다. 특히 Residual, Concatenate, Split 구조가 포함된 네트워크에서도 연산 정합성을 유지 하도록 설계하였다. 실험 결과, FPKM은 30%, 50%, 70% 전 구간에서 FLOPs와 추론 시간을 감소시키면서도 성능 저하는 제한적으로 유지하였다. GPU(RTX 2080 Ti) 환경에서 50% 가지치기 시 추론 시간은 4.4 ms에서 2.6 ms로 약 41% 단축되었으며, mAP50은 79.5%에서 77.3%로 2.2% 감소하였다. CPU 환경에서도 baseline 54.3 ms, 5.8 G FLOPs에서 32.5 ms, 3.7 G FLOPs(50%)로 감소하여 약 40% 수준의 연산 효율 개선을 확인하였다. 이를 통해 제안한 방법이 GPU뿐 아니라 CPU 기반 엣지 환경에서도 효과적인 경량화 기법임 을 확인하였다.
목차
Abstract
1. 서론
2. 관련연구
2.1 영상 기반 화재 감지 기술
2.2 YOLO 계열 객체 탐지 모델
2.3 모델 경량화와 가지치기
2.4 YOLOv12 경량화 및 가지치기 관련 연구
3. 방법론
3.1 FPKM 기반 구조적 가지치기 기법
3.2 모델 재구성
4. 실험 결과 및 분석
4.1 실험 데이터셋
4.2 실험 환경 설정
4.3 경량화 기법의 성능 비교
5. 결론
Acknowledgements
참고문헌
