


머신러닝과 통계분석 기법의 비교분석을 통한 건물에 대한 서울시 구별 지진취약도 등급화 및 위험건물 밀도분석


District-Level Seismic Vulnerability Rating and Risk Level Based-Density Analysis of Buildings through Comparative Analysis of Machine Learning and Statistical Analysis Techniques in Seoul

김상빈, 김성훈, 김대현

In the recent period, there have been numerous earthquakes both domestically and internationally, and buildings in South Korea are particularly vulnerable to seismic design and earthquake damage. Therefore, the objective of this study is to discover an effective method for assessing the seismic vulnerability of buildings and conducting a density analysis of high-risk structures. The aim is to model this approach and validate it using data from pilot area(Seoul). To achieve this, two modeling techniques were employed, of which the predictive accuracy of the statistical analysis technique was 87%. Among the machine learning techniques, Random Forest Model exhibited the highest predictive accuracy, and the accuracy of the model on the Test Set was determined to be 97.1%. As a result of the analysis, the district rating revealed that Gwangjin-gu and Songpa-gu were relatively at higher risk, and the density analysis of at-risk buildings predicted that Seocho-gu, Gwanak-gu, and Gangseo-gu were relatively at higher risk. Finally, the result of the statistical analysis technique was predicted as more dangerous than those of the machine learning technique. However, considering that about 18.9% of the buildings in Seoul are designed to withstand the Seismic intensity of 6.5 (MMI), which is the standard for seismic-resistant design in South Korea, the result of the machine learning technique was predicted to be more accurate. The current research is limited in that it only considers buildings without taking into account factors such as population density, police stations, and fire stations. Considering these limitations in future studies would lead to more comprehensive and valuable research.


최근 국내‧외적으로 많은 지진이 발생하고 있는 상황에서, 우리나라의 건물은 내진설계 및 지진피해에 매우 취약한 상황이다. 따라서 현 연구의 목적은 건물에 대한 지진취약도 등급화 및 위험건물 밀도분석을 수행하는 효과적인 방법을 발굴 하고 이를 모델화하여, 시범지역(서울시)자료를 활용해 검증해 보는데 있다. 이를 위해 활용된 두 가지 모델링 기법 중, 통계 분석 기법의 예측정확도는 87%였고, 머신러닝 기법은 Random Forest모델의 예측정확도가 가장 높았으며, 해당 모델의 Test Set 정확도는 97.1%로 도출되었다. 분석결과, 구별 등급화 결과는 광진구와 송파구가 상대적으로 위험하다고 예측되었 으며, 위험건물 밀도분석은 서초구, 관악구, 강서구가 상대적으로 위험하다고 예측되었다. 최종적으로, 통계분석 기법을 활용 한 분석결과가 머신러닝 기법을 활용한 분석결과보다 위험하게 도출되었으나, 우리나라에서는 지진 강도 6.5(MMI)가 내진설 계의 기준인데, 서울시 건물의 약 18.9%가 내진설계 되어있는 것으로 확인된 것을 고려하면, 머신러닝 기법의 결과가 더 정 확할 것으로 예측되었다. 현 연구는 인구 및 인프라와 경찰서, 소방서 등을 고려 않은 오직 건물만을 고려한 한계점이 있으며, 해당 한계를 포함해 수행하면 더욱 포괄적인 연구가 될 것이다.


1. 서론
2. 이론적 배경
2.1 공간분석의 배경
2.2 통계분석의 배경
2.3 머신러닝의 배경
2.4 기존 연구와 차별점
3. 모델링
3.1 통계분석 기법의 모델
3.2 머신러닝 기법의 모델링
4. 공간분석결과
4.1 서울시 개별건물별 지진취약도 분석결과
4.2 서울시 구별 지진취약도 등급화 결과
4.3 서울시 위험건물 밀도분석결과
5. 결론


  • 김상빈 Sang-Bin Kim. 남서울대학교 드론공간정보공학과 박사과정 학생
  • 김성훈 Seong H. Kim. 남서울대학교 드론공간정보공학과 교수
  • 김대현 Dae-Hyeon Kim. 한국전력 데이터사이언스연구소 일반연구원


