earticle

논문검색

헬스케어 합성데이터의 동향과 검증방안 연구

원문정보

Research on Trends and Validation Methods for Healthcare Synthetic Data

김성현, 양일형, 고민삼, 강하예진

피인용수 : 0(자료제공 : 네이버학술정보)

초록

영어

The increasing importance of machine learning in precision medicine and medical imaging interpretation has highlighted the need for large, high-quality datasets. However, legal and ethical restrictions surrounding personal medical data present ongoing challenges to data access and utilization. In response, synthetic data have emerged as a promising alternative for overcoming data scarcity in healthcare AI. This study proposes a comprehensive framework for the generation and validation of high-resolution synthetic data based on intraoral clinical images for dental diagnosis. Leveraging generative models, we developed a divide-and-conquer approach to synthesize realistic dental images while preserving anatomical characteristics. A robust multi-step validation process—including quantitative evaluations (e.g., FID, mAP) and qualitative clinical assessments such as Visual Turing Tests—was applied using data from Seoul National University Dental Hospital. The results demonstrated that the synthetic data achieved comparable quality to real-world data and significantly improved the performance of AI models for cavity classification and tooth segmentation. This research not only presents a novel and practical approach to synthetic healthcare data generation and validation but also provides policy insights into its safe use and future potential.

한국어

최근 의료 분야에서는 의료영상 판독 및 정밀 의료 분야에서 기계학습 기술이 적용되어 병리학 적 판단과 진단에 중요한 역할을 하고 있지만, 방대하고 다양한 의료 데이터를 얻기는 여전히 어려운 문제이다. 이는 정부 규제와 개인정보보호에 따른 윤리적 문제로 인한 제약 때문으로, 합성데이터는 인공지능 알고리즘으로 데이터를 생성하여 이러한 어려움을 극복할 수 있는 대안으로 주목받고 있다. 본 연구는 치과 진단을 위한 구강 내 임상 영상 기반 고해상도 합성데이터 생성 및 검증을 위한 포괄 적인 프레임워크를 제안한다. 생성 모델을 활용하여 해부학적 특성을 보존하면서 현실적인 치과 영상 을 합성하기 위한 분할 정복 접근법(divide-and-conquer)을 개발하였으며, 서울대학교 치과병원 데이 터를 활용해 FID(Frechet Inception Distance), mAP(mean Average Precision) 등의 정량적 평가 와 시각적 튜링 테스트를 포함한 다단계 검증 프로세스를 적용하였다. 연구 결과 합성데이터는 실제 데이터와 유사한 품질 수준을 달성했으며 충치 분류 및 치아 분할 AI 모델 성능을 크게 향상시켰음을 확인하였다. 이 연구는 의료 합성데이터 생성·검증을 위한 혁신적 접근법을 제시하는 동시에 안전한 활용을 위한 정책적 대안을 제공할 것이다.

목차

요약
Abstract
1. 서론
2.1. 합성데이터의 개요와 구축사례
3.1. 합성데이터의 구축 프로세스 및 사례
3.2 서울대학교치과병원 합성데이터 구축 사례
4.1. 합성데이터의 검증 지표 검토
5.1. 합성데이터 검증 기준 및 적용사례
5.2. 구강이미지 합성데이터 검증 기준
6. 향후 연구방안 및 정책적 시사점
6.1. 합성데이터: 의료 AI와 데이터 활용의 핵심 도구
6.2. 합성데이터 활용의 가능성과 한계
6.3. 합성데이터의 한계 극복을 위한 제언
REFERENCES

저자정보

  • 김성현 Kim, Sung-Hyun. 한국지능정보사회진흥원 수석연구원
  • 양일형 Yang, Il-Hyung. 서울대학교 치의학대학원 부교수
  • 고민삼 Ko, Min-Sam. 한양대학교 대학원 인공지능융합학과 부교수
  • 강하예진 Kang, Ha-Ye-Jin. 국립암센터 국제암대학원대학교 연구원

참고문헌

자료제공 : 네이버학술정보

    함께 이용한 논문

      ※ 기관로그인 시 무료 이용이 가능합니다.

      • 5,400원

      0개의 논문이 장바구니에 담겼습니다.