초록 열기/닫기 버튼

오랜 시간 다양한 식물자원들은 인간의 질병 치료를 위해서 활용되어왔다. 인간이 섭취한 식물들은 인체의 여러 생리활성 기전에 영향을 미친다. 주요한 기전으로 세포독성, 항염증, 항산화 기전이 있다. 식물과 생리활성 대한 데이터베이스를 구축하는 것은 천연물 기반 신약 개발을 위한 기초 자료로 사용되기 때문에 중요하다. 식물의 구성성분과 그 생리활성에 대한 다양한 문헌을 분석하는 것은 그러한 데이터를 구축 할 수 있는 방법 중 하나이다. 식물을 이루는 다양한 구성성분과 생리활성 기전 사이의 연관관계를 연구한 수많은 문헌의 초록이 PubMed에 등록되어있다. 그러나 PubMed의 수천만 개의 문헌들에서 식물들의 생리활성 기전과 연관된 문헌을 스크리닝하고 그 식물들의 구성성분과 생리활성 기전 사이의 관계를 기술한 문헌을 읽어서 체계화 하는 작업은, 관련 도메인 전문가라고 하더라도 많은 시간과 노동이 소모되는 일이다. 그래서 우리는 효율적인 데이터의 구축을 지원할 수 있는 자동화된 데이터 생성 툴을 개발했다. 이 시스템은 생리활성이나 식물에 대한 문헌들로 그룹화하는 기능과 생리활성과 관련한 문헌의 주요 키워드를 하이라이트 하는 기능을 제공한다. 이 시스템은 어노테이터들의 작업 편의성을 위해서 생리활성 관련된 문헌을 선별할 수 있는 자동 분류기능을 제공한다. 향후의 연구에서는 고급 기계 학습기법을 적용하여 추가적인 어노테이션 자동화를 기대할 수 있다. 우리의 시스템은 텍스트 데이터의 어노테이션이 요구되는 다양한 연구 도메인에 확장 적용할 수 있다.


Plant resources have long been used to treat human diseases. Plants consumed by humans affect various biological activity mechanism of the human body. Cytotoxicity, anti-inflammatory, and antioxidant mechanisms are the major biological activities of the plants. Constructing a database of plants and their biological activities is essential because it is used as foundation data for novel drug discovery from natural products. One of the ways to construct plant-biological activity database is to analyze the various literature on plant compound information. Although numerous articles that studied the relationship between the plants and the mechanism of biological activities are registered in PubMed, it requires lots of time and labor even for the relevant domain experts to screen relevant articles from numerous search results and to extract information from the text. To construct plant-biological activity database efficiently, we have developed a document screening and information extraction tool supported by text-mining techniques. The system provides a feature that groups articles into a particular biological activity or plant and another feature that highlight keywords in different colors. Additionally, an automatic article classification feature is provided to rapidly screen relevant and irrelevant documents. In future studies, more annotation automation features can be added to the system by adapting advanced machine learning techniques. Our system may be modified and applied for text data analysis of various research domains.