earticle

논문검색

나라장터 입찰공고 인공지능 검색모델 개발에 관한 연구

원문정보

A Study on the Development of AI Search Model for G2B Tender Notice

이선표, 현철호, 장수현, 지학수, 박승범

피인용수 : 0(자료제공 : 네이버학술정보)

초록

영어

The searching service of Nara Market(g2b.go.kr) is so inaccurate that many users feel uncomfortable. Procurement companies that want to participate in bidding are spending a lot of time searching for tender notices, resulting in waste of business hours. In this paper, we study the method of deriving a neural network-based information retrieval model to replace the uncomfortable and inaccurate search service of the Nara Market tender notice. We tried to improve user satisfaction by re-ranked search results based on BERT, which brought remarkable development in information retrieval. In order to preprocess the data required for neural network-based IR model training, document was divided into passages based on existing studies, and keywords were extracted from the passages to generate pseudo-queries. Q-d pairs were generated as pseudo-label using BM25 model of Elastic Search with the generated pseudo-queries. An IR model suitable for tender notice data developed through various experiments according to changes in hyperparameter values such as the amount and type of learning dataset, batch size, learning rate, and positive labeling ratio. The developed IR model showed much more accurate search results than the current Nara Market.

한국어

나라장터(g2b.go.kr)의 검색 기능은 매우 부정확하여 많은 사용자들이 불편을 느끼고 있다. 입 찰에 참여하려는 조달 기업은 입찰공고의 검색에 많은 시간을 소비하여 업무시간의 낭비를 초래하고 있다. 본 논문에서는 나라장터 입찰공고의 불편하고 부정확한 검색기능을 대체할 신경망 기반의 정보 검색 모델을 도출하는 방안을 연구하였다. 자연어 검색에 획기적인 발전을 가져온 BERT를 기반으로 검색결과를 리랭킹함으로써 사용자의 만족도를 향상시키고자 하였다. 신경망 기반 IR모델 학습에 필 요한 데이터를 전처리하기 위하여 기존의 연구를 토대로 문서를 구절로 분할하고, 분할된 구절에서 키 워드를 추출하여 의사-질의를 생성하였다. 생성된 의사-질의를 입력으로 엘라스틱 서치의 BM25모델 을 사용하여 의사-레이블인 질의-문서쌍(q-d pair)을 생성하였다. 학습용 데이터셋의 양과 유형, 배치 크기, 러닝 레이트, positive 라벨링 비율 등의 하이퍼파라미터 값 변화에 따른 다양한 실험을 통하여 입찰공고 데이터에 적합한 IR모델을 개발하였다. 개발된 IR모델로 실제 입찰공고 조회시 현행 나라 장터보다는 훨씬 정확한 검색결과를 보여주었다.

목차

요약
Abstract
1. 서론
2. 관련 연구
2.1 정보검색 기술의 발전과정
2.2 자연어처리(NLP)를 위한 자기 지도학습(self-super-visedlearning)
2.3 합성 질문(synthetic question)을 이용한 데이터 증강(data augmentation)
2.4 정보검색 모델 평가를 위한 성능지표
3. 조달 입찰정보 검색 플랫폼 최적화 모델설계
3.1 입찰정보 검색 서비스 플랫폼 목표 모델
3.2 AI모델 학습을 위한 데이터 전처리 과정
4. IR모델 개발 및 튜닝
4.1 데이터 전처리
4.2 모델 학습
5. IR모델 평가
6. 결론
REFERENCES

저자정보

  • 이선표 Sun-Pyo Lee. (주)지란지교시큐리티 지능정보사업TF장
  • 현철호 Chul-Ho Hyun. (주)써티웨어 부사장
  • 장수현 Suehyun Chang. 두리암특허법률사무소 대표변리사, 리빈AI 부사장
  • 지학수 Hak-Soo Ji. (주)지란지교시큐리티 지능정보사업TF 개발팀장
  • 박승범 Seungbum Park. 호서대학교 기술경영전문대학원 교수

참고문헌

자료제공 : 네이버학술정보

    함께 이용한 논문

      ※ 기관로그인 시 무료 이용이 가능합니다.

      • 4,600원

      0개의 논문이 장바구니에 담겼습니다.