강화학습에 기초한 지능형 웹 검색의 과잉적합 감소방안

한송이; 정용규

논문

강화학습에 기초한 지능형 웹 검색의 과잉적합 감소방안

원문정보

Overfitting Reduction of Intelligence Web Search based on Enforcement Learning

한송이, 정용규

국제인공지능학회(구 한국인터넷방송통신학회) 한국인터넷방송통신학회 논문지 제9권 제3호 2009.06 pp.25-30 KCI 등재후보

피인용수 : 0건 (자료제공 : 네이버학술정보)

초록

영어

Recent days intellectual systems using reinforcement learning are being researched at various fields of game and web searching applications. A good training models are called to be fitted with trainning data and also classified with new records accurately. A overfitted model with training data may possibly bring the unfavored fallacy of hasty generalization. But it would be unavoidable in actual world. The entropy and mutation model are suggested to reduce the overfitting problems on this paper. It explains variation of entropy and artificial development of entropy in datamining, which can tell development of mutation to survive in nature world. Periodical generation of maximum entropy are introduced in this paper to reduce overfitting. Maximum entropy model can be considered as a periodical generalization in intensified process of intellectual web searching.

한국어

강화학습을 통한 지능형시스템은 게임, 웹 검색 등 많은 분야에서 연구되고 있다. 좋은 훈련 모델은 훈련데이터에도 적합해야 하며 이전에 접해 보지 못한 레코드들도 정확하게 분류되어야 한다. 훈련 데이터에 잘 맞는 모델은 과잉적합 되어서 좋지 못한 일반화의 오류를 가질 수 있다. 어떤 분야에서도 이런 과잉적합은 피할 수 없는 문제이며 과잉적합을 방지하는 연구는 필요하다. 본 논문에서는 과잉적합을 감소시키기 위한 방법으로 자연계의 모델인 엔트로피와 돌연변이를 웹 검색에 적용하여 제시한다. 학습과정은 엔트로피의 변화량으로 설명될 수 있고, 자연계의 적자로 생존할 수 있는 돌연변이 현상은 데이터마이닝에서 엔트로피의 인위적 발생으로 설명될 수 있다. 즉, 최대 엔트로피를 주기적으로 발생시키는 방안을 본 논문에서 제시한다. 훈련데이터의 최대 엔트로피 모델은 지능형 웹 검색의 주기적 일반화 강화과정이라고 볼 수 있다.

요약
Abstract
I. 서론
II. 관련연구
  2.1 강화학습
  2.2 강화학습을 이용한 웹 검색
  2.3 과잉적합 문제
  2.4 엔트로피
  2.5 엔트로피 적용
III. 과잉적합 감소방법
  3.1 일반화오류 추정방법
  3.2 주기적 최대 엔트로피 강화방법
IV. 결론
참고문헌

키워드

저자정보

한송이 Song-Yi Han. 정회원, 을지대학교 의료전산학전공
정용규 Yong-Gyu Jung. 정회원, 을지대학교 의료전산학전공

참고문헌

자료제공 : 네이버학술정보

함께 이용한 논문

※ 원문제공기관과의 협약기간이 종료되어 열람이 제한될 수 있습니다.

0개의 논문이 장바구니에 담겼습니다.

earticle

강화학습에 기초한 지능형 웹 검색의 과잉적합 감소방안

원문정보

초록

목차

키워드

저자정보

참고문헌

함께 이용한 논문