원문정보
Identifying Alpha-helices in Protein Using the Contact Map and Morphological Operation
초록
영어
It is well known that the functional properties of proteins are dependent on their 3D structures. While investigating the functional properties of an unknown protein, or developing procedures for a drug design, the knowledge of 3D structures of proteins can yield useful information about the functional properties of the protein. The protein 3D structure is formed by packing the secondary structures, such as alpha-helices and beta-sheets, into one or several compact units. Therefore, identifying the alpha-helices and beta-sheets from a protein is very meaningful for analyzing protein structure. A contact map for protein structure representation can be considered as a binary image, whereby the patterns for alpha-helix and beta-sheet are visible in the contact maps. In this paper, we propose a method to identify the alpha-helix among secondary structures of proteins by the contact map and morphological operation. In the proposed method, the threshold for contact map and the structuring element for morphological operation are experimentally determined to effectively identify alpha-helices. To identify alpha-helices, the contact map is obtained from the distance matrix between the residues, and then the morphological operation with the predetermined structuring element is applied to the contact map. The experimental results show that the proposed method can be used to identify alpha-helices from proteins.
한국어
단백질의 기능은 단백질의 입체 구조과 밀접한 관련을 가지고 있는 것으로 잘 알려져 있다. 알려져 있지 않은 단백질의 기능적 특징을 알아내거나 신약 디자인을 위한 처리 과정을 개발할 때, 단백질의 입체 구조는 단백질의 기능적 특성에 대한 유용한 정보들을 제공해 준다. 단백질의 입체 구조는 단백질 2차 구조인 알파 나선(-Helix)들과 베타 병풍(-sheet)들이 하나 또는 몇 개의 덩어리로 뭉쳐짐으로써 형성된다. 따라서, 단백질 내의 알파 나선이나 베타 병풍을 알아 내는 것은 단백질 구조를 분석하는데 있어서 매우 중요한 일이다. 단백질 구조를 나타내는 컨택맵은 이진 영상이라고 할 수 있으며, 알파 나선과 베타 병풍에 대한 특징적인 패턴이 컨택맵에 나타나는 것을 볼 수 있다. 본 논문에서는 단백질을 구성하는 2차 구조 중 알파 나선을 컨택맵과 모폴로지 연산을 이용하여 검출하는 방법을 제안한다. 제안한 방법에서는 알파 나선을 효과적으로 검출하기 위한 컨택맵 임계치와 구조적 연산자를 실험적으로 미리 결정하였다. 알파 나선을 검출하기 위하여 잔기(residue) 간의 거리 행렬에 임계치를 적용하여 컨택맵을 얻고 나서 선정된 구조적 요소를 이용하여 모폴로지 연산을 수행한다. 실험 결과 제안한 방법은 단백질 구조 내의 알파 나선을 검출할 수 있음을 보였다.
목차
Abstract
1. 서론
2. 단백질 구조와 컨택맵
2.1 단백질의 구조
2.2 컨택맵
3. 컨택맵과 모폴로지 연산을 이용한 알파나선 검출
3.1 시퀀스 차이에 따른 단백질 2차 구조의 특징
3.2 컨택맵의 회전과 시퀀스 차이
3.3 모폴로지 연산
4. 실험 결과 및 분석
4.1 단백질 데이터
4.2 구조적 연산자의 선정
4.3 임계치의 결정
4.4 성능 평가 및 토의
5. 결론 및 추후 연구
감사의 글
참고문헌