하드 네거티브 샘플링을 활용한 대조 학습 기반 화자 인식 방법

전찬준; 김채호; 최지현; 배은경

Oral Session Ⅳ 인공지능 및 기계학습

하드 네거티브 샘플링을 활용한 대조 학습 기반 화자 인식 방법

원문정보

Contrastive Learning-Based Speaker Recognition Method Using Hard Negative Sampling

전찬준, 김채호, 최지현, 배은경

한국차세대컴퓨팅학회 한국차세대컴퓨팅학회 학술대회 2025 한국차세대컴퓨팅학회 춘계학술대회 2025.05 pp.227-230

피인용수 : 0건 (자료제공 : 네이버학술정보)

초록

한국어

본 논문은 화자 인식 성능 향상을 위해 대조학습 기반 화자 표현 학습에 하드 네거티브 샘플링 방식 을 결합한 방법을 제안한다. 미니배치 내에서 음성 간 유사도를 측정하여 가장 구별이 어려운 음성 샘 플을 선별하고, 이를 크로스 어텐션 메커니즘을 통해 효과적으로 학습하여 화자 간 경계를 명확히 한 다. 제안 방식은 VoxCeleb 데이터셋 실험에서 기존 방법 대비 오인율을 크게 낮추어 성능 우수성을 입증하였다.

키워드

저자정보

전찬준 Chanjun Chun. 글로소리 주식회사/조선대학교 컴퓨터공학과
김채호 Chaeho Kim. 글로소리 주식회사
최지현 Jihyeon Choi. 글로소리 주식회사
배은경 Eunkyeong Bae. 글로소리 주식회사

참고문헌

자료제공 : 네이버학술정보

함께 이용한 논문

0개의 논문이 장바구니에 담겼습니다.

earticle

하드 네거티브 샘플링을 활용한 대조 학습 기반 화자 인식 방법

원문정보

초록

목차

키워드

저자정보

참고문헌

함께 이용한 논문