earticle

논문검색

군사적 환경에서 음성인식 모델의 취약성에 관한 연구

원문정보

Study on the Vulnerabilities of Automatic Speech Recognition Models in Military Environments

원엘림, 나성중, 고영진

피인용수 : 0(자료제공 : 네이버학술정보)

초록

영어

Voice is a critical element of human communication, and the development of speech recognition models is one of the si gnificant achievements in artificial intelligence, which has recently been applied in various aspects of human life. The appli cation of speech recognition models in the military field is also inevitable. However, before artificial intelligence models ca n be applied in the military, it is necessary to research their vulnerabilities. In this study, we evaluates the military applica bility of the multilingual speech recognition model "Whisper" by examining its vulnerabilities to battlefield noise, white noi se, and adversarial attacks. In experiments involving battlefield noise, Whisper showed significant performance degradation with an average Character Error Rate (CER) of 72.4%, indicating difficulties in military applications. In experiments with white noise, Whisper was robust to low-intensity noise but showed performance degradation under high-intensity noise. A dversarial attack experiments revealed vulnerabilities at specific epsilon values. Therefore, the Whisper model requires impr ovements through fine-tuning, adversarial training, and other methods.

한국어

목소리는 인간의 의사소통에서 중요한 요소로, 음성인식 모델의 발전은 인공지능의 중요한 성과 중 하나이며 최근 인간의 생활에 다방면으로 사용되고 있다. 음성인식 모델의 활용은 군사분야에서도 피해갈 수 없는 과제이다. 하지만 인공지능 모델 의 군사적 활용 이전에 모델의 취약성에 대한 연구가 필요하다. 본 연구에서는 다국적 음성인식 모델인 Whisper의 군사적 활 용 가능성을 알아보기 위해, 전장소음, 잡음, 적대적 공격에 대한 취약성을 평가하였다. 전장소음을 포함하는 실험에서는 Whisper의 성능 저하가 크게 나타났으며, 평균 72.4%의 문자 오류율(CER)을 기록하여 군사적 활용에 어려움이 있는 것으로 나타났다. 또한, 잡음을 포함하는 실험에서는 낮은 강도의 잡음에 대해 Whisper가 강건하였으나, 높은 강도의 잡음에서는 성 능이 저하되었고, 적대적 공격 실험에서는 특정 입실론 값에서 취약성이 드러났다. 따라서 Whisper 모델을 군사적 환경에서 사용하기 위해서는 파인튜닝, 적대적 훈련 등을 통해 개선이 필요하다는 것을 시사한다.

목차

요약
ABSTRACT
1. 서론
2. 관련연구
2.1 음성인식모델
2.2 음성인식모델의 강건성
2.3 음성인식모델에 대한 적대적 공격
3. 실험환경 및 데이터
3.1 음성데이터
3.2 음성인식모델
3.3 평가지표
4. 실험결과
4.1 전장소음에 대한 취약성
4.2 잡음에 대한 취약성
4.3 적대적 공격에 대한 취약성
5. 결론
6. 향후 연구
참고문헌

저자정보

  • 원엘림 Elim Won. 육군 지능정보기술단 체계관리SW분석장교
  • 나성중 Seongjung Na. 국방대학교 군사운영분석 박사과정
  • 고영진 Youngjin Ko. 육군사관학교 컴퓨터과학과 강사

참고문헌

자료제공 : 네이버학술정보

    함께 이용한 논문

      ※ 기관로그인 시 무료 이용이 가능합니다.

      • 4,000원

      0개의 논문이 장바구니에 담겼습니다.