원문정보
A Comparative Research on Longitudinal Clustering Methods for Exploratory Longitudinal Study
초록
영어
In the era of Big Data, longitudinal data that repeatedly measure the subject are also increasing. Longitudinal research is important in finding longitudinal trajectories, and in the case of being different longitudinal subgroups, each longitudinal trajectory must be found and analyzed. In this study, we compared techniques for longitudinal clustering to find longitudinal subgroups. Three techniques were compared: SOM(Self-Organizing Map) based longitudinal clustering, K-means longitudinal clustering, and Automatic clustering. The silhouette index and Calinski & Harabasz index, which evaluate the performance of clusters, were used for comparison. The data were 1,888 longitudinal data from the Korean List of Study Agencies on Aging (KLoSA) surveyed eight times from 2006 to 2020. The technique with the best performance was K-means longitudinal clustering. This study is expected to contribute to the research effectiveness of longitudinal studies such as Latent Growth Model and Multilevel Longitudinal analysis.
한국어
빅데이터 시대를 맞이하여 동일 대상을 반복 측정하는 종단 데이터(longitudinal data)도 증가하고 있다. 종단연구 는 종단 궤적(longitudinal trajectory)을 찾는 과정이 중요한데, 종단 궤적이 서로 다른 하위 그룹은 각각의 종단 궤적을 찾 아서 분석하여야 한다. 본 연구에서는 종단 하위 그룹을 찾는 종단 클러스터링 기법을 비교하였다. 자기조직지도기법 기반 종 단 클러스터링, K-평균 종단 클러스터링, 자동클러스터링 등 3가지 기법을 비교하였고, 클러스터의 성능은 실루엣 지표, 칼 린스키와 하라바즈 지표를 사용하였다. 데이터는 고령화연구패널(KLoSA)의 2006년부터 2020년까지 8차에 걸쳐서 조사한 총 1,888개의 종단 데이터였다. 가장 성능이 우수한 기법은 K-평균 종단 클러스터링이었다. 본 연구는 잠재 성장 모형이나 다층 종단분석 등의 종단연구의 연구 효과성 향상에 이바지할 것으로 기대한다.
목차
Abstract
1. 서론
2. 종단 클러스터링(Longitudinal Clustering)
3. 연구 절차 및 방법
3.1 연구 절차
3.2 종단클러스터링 방법
3.3 평가지표
4. 연구결과
4.1 적용 데이터
4.2 자기조직화지도기법(SOM) 클러스터링
4.3 K-평균 종단 클러스터링
4.4 자동클러스터링(Auto Clustering)
5. 결론 및 토의
REFERENCES
