초록 열기/닫기 버튼

대응분석은 범주형 변수들에 의한 분할표 자료의 행과 열을 저차원 공간상에 나타내어, 그들의 관계를 시각적으로 탐색할 수 있는 유용한 자료분석 기법이다. 또한 대응분석은 분할표 자료가 아닌 어떤 형식의 2차원 표에도 적용할 수 있다는 장점을 가지고 있다. 대응분석에 의한 행렬도는 많은 분야에서 자주 사용되지만, 대부분의 경우 카이제곱거리에 기초한 대응분석이 주로 사용되는 경향이 있으며, 카이제곱거리에 기초한 대응분석에서는 상대적인 거리가 표현된다는 것을 주목할 필요가 있다. 이 논문에서는 카이제곱거리 대신에 유클리드거리에 기초한 대응분석의 개념과 절차를 자세히 소개하였으며, 실제 자료에 대한 사례분석을 통해 여러 가지 표준화 및 균등화 방법이 분석결과에 미치는 영향을 설명하였다. 이러한 결과를 통해 유클리드거리를 이용한 대응분석이 실제 문제에 사용될 때의 유용성을 제시하고자 한다.


Correspondence analysis is a useful data analysis technique that can visualize the relationship between the rows and columns of contingency table by categorical variables on the low dimensional space. It also has the advantage that the correspondence analysis can be applied to any type of two-dimensional table. It should be noted that although the biplot by the correspondence analysis is often used in many fields, in most cases the corresponding analysis based on the chi-square distance tends to be used predominantly and the relative distance is expressed in the corresponding analysis based on the chi-square distance. In this paper, the concept and procedure of the correspondence analysis based on Euclidean distance instead of the chi-square distance are introduced in detail, and illustrations of actual data show the effect of various standardization and equalization methods on the analysis results. These results show that the correspondence analysis based on Euclidean distance can be useful when used in actual problems and that the correspondence analysis can be applied to various data in many fields.