원문정보
Contrastive Learning-Based Speaker Recognition Method Using Hard Negative Sampling
피인용수 : 0건 (자료제공 : 네이버학술정보)
초록
한국어
본 논문은 화자 인식 성능 향상을 위해 대조학습 기반 화자 표현 학습에 하드 네거티브 샘플링 방식 을 결합한 방법을 제안한다. 미니배치 내에서 음성 간 유사도를 측정하여 가장 구별이 어려운 음성 샘 플을 선별하고, 이를 크로스 어텐션 메커니즘을 통해 효과적으로 학습하여 화자 간 경계를 명확히 한 다. 제안 방식은 VoxCeleb 데이터셋 실험에서 기존 방법 대비 오인율을 크게 낮추어 성능 우수성을 입증하였다.
목차
요약
1. 서론
2. 제안된 화자 인식 방법
2.1. 화자 표현 학습을 위한 대조학습
2.2. 하드 네거티브 샘플링을 통한 성능 향상
3. 실험 결과
3.1. 실험 환경 및 데이터셋 구성
3.2. 성능 결과
4. 결론
Acknowledgement
참고문헌
1. 서론
2. 제안된 화자 인식 방법
2.1. 화자 표현 학습을 위한 대조학습
2.2. 하드 네거티브 샘플링을 통한 성능 향상
3. 실험 결과
3.1. 실험 환경 및 데이터셋 구성
3.2. 성능 결과
4. 결론
Acknowledgement
참고문헌
키워드
저자정보
참고문헌
자료제공 : 네이버학술정보
