earticle

논문검색

인터넷

GraphRAG를 활용하여 뛰어난 검색과 추론 기능을 가진 EPUB 리더

원문정보

EPUB Reader with Advanced Search and Inference Functions using GraphRAG

박채원, 옥지윤, 한지운, 성주연, 황기태

피인용수 : 0(자료제공 : 네이버학술정보)

초록

영어

Domain-specific data within companies and organizations have been stored in electronic documents, but there are difficulties in understanding relationships between documents and performing accurate searches and inferences. Therefore, this paper proposed and implemented a Graph EPUB Reader system that can search and inference based on the contents of EPUB files, one of the representative formats for electronic documents. This system generates a knowledge graph from the contents of EPUB files and provides answers to both simple fact searches and inference-based searches. To validate the utilization of the system proposed in this paper, we analyzed the performances of knowledge graph generation, search, and inference. As a result of the performance evaluation, the knowledge graph creation time was measured to increase linearly depending on the size of the EPUB file, and search and inference were evaluated to have a high accuracy of about 90%. Finally, we conclude that the search and inference technology used in the Graph EPUB Reader system proposed in this paper can be used to search and infer not only EPUB files but also various electronic documents such as PDF.

한국어

기업과 조직 내 도메인 특화 데이터가 전자 문서로 저장되어 왔지만, 문서 간의 관계를 파악하고 정확한 검색과 추론을 수행하는 데 어려움이 있다. 이에 본 논문은 전자 문서를 대표하는 포맷 중 EPUB 포맷을 채택하여, EPUB 파일 속 내용을 검색하고 추론할 수 있는 Graph EPUB Reader 시스템을 제안하고 구현하였다. 이 시스템은 GraphRAG 기술을 활용하여 EPUB 파일 속 내용을 지식 그래프로 생성하고, 단순 사실 검색뿐 아니라 추론 과정을 거쳐야만 하는 검색에도 답변을 생성한다. 본 논문에서는 제안된 Graph EPUB Reader 시스템의 활용성을 검증하기 위해 지식 그래프 생성 성능과 검색과 추론 성능을 평가하였다. 성능 평가 결과, EPUB 파일의 크기에 따라 지식 그래프 생성 시간이 선형 적으로 증가하는 것으로 측정되었으며, 검색과 추론은 약 90%의 높은 정확도를 보인 것으로 평가되었다. 본 논문에서 제안한 Graph EPUB Reader 시스템에 사용된 검색과 추론 기술은 EPUB 파일뿐 아니라 PDF 등 다양한 여러 전자 문서를 검색하고 추론하는데 활용될 수 있을 것으로 판단된다.

목차

요약
Abstract
I. 서론
II. 관련 연구
1. GraphRAG
2. EPUB
III. Graph EPUB Reader
1. 시스템 구조
2. EPUB 파일로부터 지식 그래프 생성
3. 검색
4. 추론
5. 지식 그래프 시각화
IV. 성능 평가
1. 지식 그래프 생성 성능
2. 검색 성능
3. 추론 성능
V. 결론
References

저자정보

  • 박채원 Chaewon Park. 준회원, 한성대학교 컴퓨터공학부
  • 옥지윤 Jiyoon Ok. 준회원, 한성대학교 컴퓨터공학부
  • 한지운 Jiwoon Han. 준회원, 한성대학교 컴퓨터공학부
  • 성주연 Juyeon Soung. 준회원, 한성대학교 컴퓨터공학부
  • 황기태 Kitae Hwang. 종신회원, 한성대학교 컴퓨터공학부

참고문헌

자료제공 : 네이버학술정보

    함께 이용한 논문

      ※ 원문제공기관과의 협약기간이 종료되어 열람이 제한될 수 있습니다.

      0개의 논문이 장바구니에 담겼습니다.