원문정보
Semi-supervised Breast Cancer Segmentation using Recursive Pseudo-labeling in Breast Ultrasound Images
초록
영어
Accurate and rapid segmentation of breast tumors is essential for diagnosing breast cancer, particularly in young females. While ultrasound imaging provides a non-invasive and efficient approach for breast screening, segmenting breast ultrasound (BUS) images is challenging due to the wide variation in tumor size and shape, as well as ambiguous boundaries caused by speckle noise and artifacts. Additionally, limited access to annotated breast tumor datasets complicates training deep neural networks effectively. This research focuses on semi-supervised learning to train deep models with limited annotated breast tumor images. To address data scarcity, we generated pseudo-labels for unlabeled images and re-trained the model using both pseudo-labeled and originally labeled images. To mitigate potential inaccuracies in pseudo-labels that could disrupt the training process, we applied a multi-view approach to enhance pseudo-label robustness Our method achieved an 82% Dice coefficient with half of the training data annotated, approximately 77% with 1/4 annotated, and around 75% with only 1/8 labeled images on the BUSI dataset. We anticipate that this method will help reduce the label burden for radiologists.
한국어
여성에서 유방암을 진단하는 데 있어 유방 종양의 정확하고 신속한 분할은 매우 중요하다. 초음파 이미지는 비침 습적이고 효율적인 유방 검진 방법을 제공하나, 유방 초음파 이미지에서 종양의 모양대로 segmentation하는 것은종양 크기와 형태의 다양성, 스펙클 노이즈와 인공보형물등으로 인한 불명확한 경게 때문에 쉽지 않은 문제다. 또한, label이 있는 유방 종양 데이터셋이 많지 않기 때문에 심층신경망(deep neural net)을 잘 훈련시키기 어렵다. 본 연구에서는 한정된 labeled data로 심층 신경망모델을 훈련하기 위해 준지도 학습(semi-supervised learning)을 활용한다. 데이 터 부족 문제를 해결하기 위해 라벨이 없는 데이터(unlabeled data)에 대해 유사 라벨(pseudo-label)을 생성하고, 유 사 라벨이 달린 이미지와 원래 라벨이 달린 이미지를 모두 사용하여 모델을 재훈련한다. 제안한 방법은 BUSI 데이터셋 에서 학습 데이터의 절반만 label이 제공된 경우 약 82%의 Dice 계수를 달성하며, 1/4만 label이 제공된 경우 약 77%, 1/8만 label이 제공된 경우 약 75%의 성능을 보인다. 본 연구는 방사선 전문의의 labeling 작업 부담을 줄이는 데 기여 할 것으로 기대된다.
목차
Abstract
Ⅰ. 서론
Ⅱ. 본론
1. 전체 알고리즘 소개
2. 유사 라벨 생성
Ⅲ. 실험 및 결과
Ⅳ. 결론
References
