원문정보
Prediction of Ovarian Cancer Stage Using Meta-integrated Microarray Data and Random Forest
초록
영어
Ovarian cancer is difficult to diagnose early and is typically detected at advanced stages (Stage III or IV), resulting in the highest mortality rate among gynecological cancers. As treatment strategies and prognosis vary significantly according to stage, accurate stage prediction is clinically crucial. In this study, we integrated six microarray datasets based on the Affymetrix GPL570 platform, securing a total of 995 samples to explore genes or gene sets that could be utilized for ovarian cancer stage prediction. By applying a Random Forest model to the integrated data and selecting 100 genes based on feature importance, we achieved an overall accuracy of 98.0% in binary classification (early stages I-II vs. advanced stages III-IV) using the expression patterns of these genes. The gene set identified in this study could be effectively utilized for establishing precision medicine strategies based on ovarian cancer stage prediction.
한국어
난소암은 조기진단이 어려워 대부분 진행된 병기(III기 또는 IV기)에서 발견되며, 이로 인해 부인과 암 중 가장 높은 사망률을 보인다. 병기에 따라 치료 전략과 예후가 크게 달라지므로, 정확한 병기 예측은 임상적으로 매우 중요하 다. 본 연구에서는 난소암의 병기 예측에 활용할 수 있는 유전자 또는 유전자 군을 탐색하기 위해, Affymetrix GPL570 플랫폼 기반의 여섯 개 마이크로어레이 데이터셋을 통합하여 총 995개의 샘플을 확보하였다. 통합 마이크로어레이 데이 터에 랜덤 포레스트(Random Forest) 모델을 적용하고, 피처 중요도에 기반하여 100개의 유전자를 선별하였다. 이들 유전자의 발현 패턴을 활용한 이진 분류(초기 병기 I–II vs. 진행 병기 III–IV)에서 총괄 정확도 98.0%를 달성하였다. 본 연구에서 도출된 유전자군은 난소암의 병기 예측을 기반으로 한 정밀 의료 전략 수립에 유용하게 활용될 수 있을 것으로 기대된다.
목차
Abstract
Ⅰ. 서론
Ⅱ. 본문
1. 난소암 마이크로어레이 데이터셋
2. 난소암 마이크로어레이 데이터셋의 통합
3. 난소암 병기 진단을 위한 유전자 선별
4. 유전자 온토로지 분석
Ⅲ. 결과
1. 난소암 마이크로어레이 데이터셋의 통합
2. 난소암 병기 진단을 위한 유전자 선별
3. 난소암 진단을 위해 선별된 유전자의 온톨리지 분석
Ⅳ. 고찰 및 결론
References
