원문정보
An Integrated Analysis for Mutational Signatures and Gene Expression Data and Prioritizing Signature-specific Transcription Factors
초록
영어
Studies on somatic mutations have contributed to identifying the aetiology of cancer. In particular, the concept of mutational signatures was defined based on the large-scale human genome sequencing data. In this study, we propose an analysis framework that can discover the association between mutational signatures and gene expressions based on the multiomics analysis using non-negative factorization and correlation analysis. The proposed method was used to analyze PCAWG colon cancer dataset and detected 14 transcription factors out of 178 that regulate target genes’ expression affected by the mutational signature. Literature servey on colon cancer revealed that the detected transcripton factors and mutational signatures are relevant to the mechanism of colon cancer, showing the reliability of the proposed method.
한국어
DNA 염기서열의 체세포 돌연변이 연구는 암의 발병 원인을 밝히는 데에 중요한 역할을 수행하여 왔다. 특히, 대규모 인간 암 유전체 데이터를 활용한 돌연변이 시그니처(mutational signature)의 개념이 정의된 이후 관련 연구가 활발히 진행되고 있다. 본 연구에서는 비음수 행렬 분해 및 상관분석을 기반으로 돌연변이 시그니처 에 유전자 발현 정보를 결합하는 멀티오믹스(multiomics) 분석 프레임워크를 개발하고, 이를 PCAWG 대장암 데 이터에 적용하였다. 178개 전사인자에 대한 분석 결과, 돌연변이 시그니처에 의해 타겟 유전자의 발현에 영향을 준 전사인자를 14개 선발하였다. 기존 대장암 연구에 대한 문헌 분석을 통해 본 연구에서 선발된 전사인자와 돌연 변이 시그니처가 대장암 관련 메커니즘에 관여하고 있음을 보이고 제안된 연구 기법의 신뢰성을 확인하였다.
목차
Abstract
Ⅰ. 서론
Ⅱ. 본론
2.1 돌연변이 시그니처의 기여도 분석
2.2 멀티오믹스 상관분석을 통한 돌연변이 시그니처 연관 전사인자 선발
Ⅲ. 실험 결과
3.1 실험 데이터
3.2 분석 결과
Ⅳ. 논의
Ⅴ. 결론
REFERENCES