earticle

논문검색

Oral Session Ⅳ 인공지능 및 기계학습

하드 네거티브 샘플링을 활용한 대조 학습 기반 화자 인식 방법

원문정보

Contrastive Learning-Based Speaker Recognition Method Using Hard Negative Sampling

전찬준, 김채호, 최지현, 배은경

피인용수 : 0(자료제공 : 네이버학술정보)

초록

한국어

본 논문은 화자 인식 성능 향상을 위해 대조학습 기반 화자 표현 학습에 하드 네거티브 샘플링 방식 을 결합한 방법을 제안한다. 미니배치 내에서 음성 간 유사도를 측정하여 가장 구별이 어려운 음성 샘 플을 선별하고, 이를 크로스 어텐션 메커니즘을 통해 효과적으로 학습하여 화자 간 경계를 명확히 한 다. 제안 방식은 VoxCeleb 데이터셋 실험에서 기존 방법 대비 오인율을 크게 낮추어 성능 우수성을 입증하였다.

목차

요약
1. 서론
2. 제안된 화자 인식 방법
2.1. 화자 표현 학습을 위한 대조학습
2.2. 하드 네거티브 샘플링을 통한 성능 향상
3. 실험 결과
3.1. 실험 환경 및 데이터셋 구성
3.2. 성능 결과
4. 결론
Acknowledgement
참고문헌

저자정보

  • 전찬준 Chanjun Chun. 글로소리 주식회사/조선대학교 컴퓨터공학과
  • 김채호 Chaeho Kim. 글로소리 주식회사
  • 최지현 Jihyeon Choi. 글로소리 주식회사
  • 배은경 Eunkyeong Bae. 글로소리 주식회사

참고문헌

자료제공 : 네이버학술정보

    함께 이용한 논문

      0개의 논문이 장바구니에 담겼습니다.