원문정보
Entity Embeddings for Enhancing Feasible and Diverse Population Synthesis in a Deep Generative Models
초록
영어
An activity-based model requires detailed population information to model individual travel behavior in a disaggregated manner. The recent innovative approach developed deep generative models with novel regularization terms that improves fidelity and diversity for population synthesis. Since the method relies on measuring the distance between distribution boundaries of the sample data and the generated sample, it is crucial to obtain well-defined continuous representation from the discretized dataset. Therefore, we propose an improved entity embedding models to enhance the performance of the regularization terms, which indirectly supports the synthesis in terms of feasible and diverse populations. Our results show a 28.87% improvement in the F1 score compared to the baseline method.
한국어
활동기반 모델은 현대의 복잡한 개인의 통행행태를 반영한 정교한 기반의 수요예측이 가능 하지만, 분석 대상지의 상세한 인구정보가 필수적으로 요구된다. 최근 다양한 심층생성 모델을 활용한 합성인구 생성 기법이 개발되었고, 설문조사를 통해 수집된 샘플 데이터에 존재하지 않는 실제 인구와 유사한 인구 특성을 모사한 데이터를 생성해내는 방법론이 제시되었다. 이 는 이산형으로 이루어진 샘플 데이터를 연속형 데이터로 변환하여 분포 영역을 정의한 뒤 생 성된 표본 데이터의 거리를 정교하게 계산하여, 불가능한 인구 특성 조합을 억제하는 방식으 로 데이터의 확률 분포를 학습한다. 하지만 데이터 변환 과정에 활용되는 개체 임베딩이 잘 학습되지 않으면 의도와 다르게 왜곡된 연속형 분포 영역이 정의될 수 있고, 원본 데이터 표현 의 오류로 인한 잘못된 합성인구를 생성할 가능성이 존재한다. 따라서 본 연구에서는 정확도 높은 임베딩을 추출하여 간접적으로 합성인구 생성 성능을 증가시키고자 한다. 결과적으로 합 성인구의 다양성과 정확성 측면에서 기존 대비 약 28.87% 성능이 향상하였다.
목차
ABSTRACT
Ⅰ. 서론
1. 개요
Ⅱ. 문헌 검토
1. 생성모델 기반 합성인구 생성 방안
2. 개체 임베딩 추출 기법
Ⅲ. 방법론
1. 데이터셋 구축 과정 및 실험적 가정
2. 개체 임베딩 추출 및 연속형 공간 변환 방안
3. 합성인구 생성 모델 프레임워크
Ⅳ. 결과 및 고찰
Ⅴ. 결론
ACKNOWLEDGEMENTS
REFERENCES
