원문정보
Structural Characteristics of Expression Module of Unidentified Genes from Metagenome
초록
영어
The exploitation of metagenome, the access to the natural extant of enormous potential resources, is the way for elucidating the functions of organism in environmental communities, for genomic analyses of uncultured microorganism, and also for the recovery of entirely novel natural products from microbial communities. The major breakthrough in metagenomics is opened by the construction of libraries with total DNAs directly isolated from environmental samples and screening of these libraries by activity and sequence-based approaches. Screening with activity-based approach is presumed as a plausible route for finding new catabolic genes under designed conditions without any prior sequence information. The main limitation of these approaches, however, is the very low positive hits in a single round of screening because transcription, translation and appropriate folding are not always possible in E. coli, a typical surrogate host. Thus, to obtain information about these obstacles, we studied the genetic organization of individual URF's (unidentified open reading frame from metagenome
sequenced and deposited in GenBank), especially on the expression factors such as codon usage, promoter region and ribosome binding site (rbs), based on DNA sequence analyses using bioinformatics tools. And then we also investigated the above-mentioned properties for 4100 ORFs (Open Reading Frames) of E. coli K-12 generally used as a host cell for the
screening of noble genes from metagenome. Finally, we analyzed the differences between the properties of URFs of metagenome and ORFs of E. coli. Information derived from these comparative metagenomic analyses can provide some specific features or environmental blueprint available to screen a novel biocatalyst efficiently.
한국어
본 연구는 메타게놈 유전자 특성과 E. coli 에서 정상적으로 발현되는 유전자 특성을 생물정보학 기법으로 비교·분석하고 그 결과를 메타게놈 선별 연구에 활용하고자 하는데 그 목적을 두었다. 이를 위하여 메타게놈 유래의 URF 와 숙주세포로 이용되는 E. coli의 ORF에 대한 염기구조, 발현되는 단백질의 크기 및 분자량, 아미노산의 구성 및 코돈사용은 물론 전사와 번역에 관여하는 프로모터 부위와 리보솜 결합부위의 보존서열 특성을 비교·분석하였다.
메타게놈과 E. coli가 합성하는 단백질의 크기와 분자량은 매우 비슷한 경향을 보였으나, 아미노산의 조성비, G+C 함량 및 코돈사용에서는 매우 다른 경향을 나타내었다. 특히 전사와 번역에 직접적으로 관여하는 프로모터와 RBS 영역에서의 DNA 보존서열이 상당부분 부합되지 않아 E. coli에서 메타게놈의 발현율이 현저히 낮을 것으로 예측할 수 있었다. RBS와 같이 유전자 발현에 필수적인 조절인자가 메타게놈과 E. coli에서 큰 차이를 나타내는 문제점은 메타게놈으로부터 유용한 유전자원을 탐색하는 연구에서 심도있게 개선하여야 할 사항이다. 부분적으로는 라이브러리 구축에 사용되는 벡터 및 숙주의 개량을 통하여 위의 문제를 극복할 수도 있을 것이다.
목차
서론
재료 및 방법
Metagenome DNA 및 단백질 서열정보 수집
단백질 발현과 관련한 분석항목의 결정
미규명 유전자의 특성 분석
전사 및 번역에 관련한 유전서열의 분석
결과 및 고찰
메타게놈 유래 단백질의 분자량 및 pI 분포 경향
아미노산 조성분석
G+C 함량 분석
코돈사용 분석
전사 및 번역 인자의 특성 분석
요약
REFERENCES