earticle

논문검색

LDA 토픽 모델링과 Word2vec을 활용한 유사 특허문서 추천연구

원문정보

LDA Topic Modeling and Recommendation of Similar Patent Document Using Word2vec

이앞길, 최근호, 김건우

피인용수 : 0(자료제공 : 네이버학술정보)

초록

영어

With the start of the fourth industrial revolution era, technologies of various fields are merged and new types of technologies and products are being developed. In addition, the importance of the registration of intellectual property rights and patent registration to gain market dominance of them is increasing in oversea as well as in domestic. Accordingly, the number of patents to be processed per examiner is increasing every year, so time and cost for prior art research are increasing. Therefore, a number of researches have been carried out to reduce examination time and cost for patent-pending technology. This paper proposes a method to calculate the degree of similarity among patent documents of the same priority claim when a plurality of patent rights priority claims are filed and to provide them to the examiner and the patent applicant. To this end, we preprocessed the data of the existing irregular patent documents, used Word2vec to obtain similarity between patent documents, and then proposed recommendation model that recommends a similar patent document in descending order of score. This makes it possible to promptly refer to the examination history of patent documents judged to be similar at the time of examination by the examiner, thereby reducing the burden of work and enabling efficient search in the applicant’s prior art research. We expect it will contribute greatly.

한국어

4차 산업혁명 시대의 시작과 함께 다양한 분야의 기술들이 서로 융합하며 새로운 형태의 기술과 제품들이 개발되고 있으며, 이와 더불어 그것들에 대한 시장 지배력을 갖기 위한 지식 재산권의 행사나 특허등록의 중요성이 높아지고 있어 국내는 물론 해외에서의 특허출원이 증가하고 있다. 이에 따라, 심사관 1인당 처리해야 할 특허 처리 건수가 해마다 많아지고 있어 선행기술조사에 소비되는 시간과 비용이 점점 증가하고 있는 실정이다. 본 연구는 다수의 해외특허 우선권 주장 시 동일 우선권 주장 특허문서 간 유사도를 계산하여 심사관 및 특허 출원인이 유사문서를 우선 검토 할 수 있도록 함으로써 심사 시간과 비용을 줄이고자 하였다. 이를 위해, 본 연구에서는 비정형 특허 문서의 데이터를 전처리 후 LDA 토픽 모델링과 Word2vec을 활용하여 특허 문서 간 유사도를 구하고, 이 유사도 점수가 높은 순으로 검토 문서를 우선 추천하는 유사 특허 추천 모델을 제안하였다. 3단계의 모델 생성과정을 통해 만들어진 모델을 사용하여 재현율 95%로 높은 결과를 보였다. 본 연구에서 제안한 모델을 통해, 심사관은 효율적으로 선행기술에 대한 조사가 가능해지며, 심사 수행 중 유사하다고 판단된 특허문서에 대한 심사 이력을 신속하게 참고할 수 있어 업무 부담감을 줄이고 심사풀질을 향상시킬 수 있을 것으로 기대된다.

목차

요약
Ⅰ. 서론
1.1 연구의 배경
1.2 연구의 목적
1.3 연구의 범위
Ⅱ. 관련 연구
2.1 특허
2.2 Vector Space Model
2.3 Word Embedding
2.4 Perceptrons
2.5 Word2vec
2.6 LDA(Latent Dirichlet Allocation)
2.7 선행연구와의 차별점
Ⅲ. 모델 생성
3.1 데이터 수집
3.2 데이터 전처리
3.3 모델 선택
Ⅳ. 모델 적용
Ⅴ. 결론
참고문헌
Abstract

저자정보

  • 이앞길 Apgil Lee. 한밭대학교 경영학과 박사과정
  • 최근호 Keunho Choi. 한밭대학교 경영회계학과 조교수
  • 김건우 Gunwoo Kim. 한밭대학교 경영회계학과 부교수

참고문헌

자료제공 : 네이버학술정보

    함께 이용한 논문

      ※ 기관로그인 시 무료 이용이 가능합니다.

      • 4,800원

      0개의 논문이 장바구니에 담겼습니다.