초록 열기/닫기 버튼

방언지도의 제작 목적은 방언의 지리적인 분포를 특별한 지도 형식으로 시각화하여 지도상의 크고 작은 방언 경계를 확인하는 데 있다. 또한 방언지도에체계적인 의미를 부여하고 방언형의 공간적인 분포 유형을 해석하면서 시간적인 변화 관계를 탐색할 수 있다. 방언학 연구에서 중요한 연구 결과인 방언지도를 분석하면 방언 자료의 지리적 분포로부터 언어의 역사를 추정할 수 있을 뿐만 아니라, 방언 자료에 대한 해석이 용이해지고, 글이나 표에서 보이지 않던것까지 볼 수 있게 되는 이점이 있다. 본 연구에서는 언어지도를 해석할 때 기준으로 삼고 있는 방언 분포의 유형을 수치화하고 이를 통계 처리하여 분석하는 방법을 개발하고자 한다. 이를 ‘방언 분포 통계분석법’이라고 할 수 있다. 이 연구는 김덕호(2001)에서구축한 경북 방언 데이터는 총 15,435개의 개별 방언값을 활용하고, 이러한데이터를 방언 분포 통계분석법으로 처리하여 분석한다. 방언 분포 통계분석법은 다음과 같은 과정을 통해 이루어진다. 첫째, 방언지도의 방언형 분포 유형을 분석한다. 둘째, 방언 데이터 처리는 지점 당방언형별 가중치 점수로 환산하고 합산하여 종합 점수로 산출한다. 셋째, 사분면 산점도를 제작하고, 이를 근거로 다차원척도법을 활용하여 방언 분포의 경향성과 평균값 및 표준편차를 산출한다. 넷째, 산출된 통계값으로 다변량 분석을 하여 상관값(유클리드 거리행렬:최단거리행렬)을 구하고 파레토 차트와 근접도 카토그램을 제작하여 지점 간의 상관관계를 분석한다. 또한, 분류도(dendrogram)를 제작하여 계층적 군집 분석을 시도하고자 한다.


The purpose of this study is to develop a method for statistically processing and analyzing patterns of dialect distribution, which serve as the criteria for analyzing dialect maps, and this method is referred to as the "statistical analysis method of dialect distribution." Based on statistical analysis of dialect distribution, this study utilizes Gyeongsangbuk-do dialect data established by Kim Deok-ho(2001), which undergoes statistical processing. The dialect distribution statistical analysis method proceeds in the following steps: First, we analyze the distribution of dialect types on dialect maps. Second, dialect data is converted into weight scores for each dialect type, summed up, and the total score is calculated. Third, a quadrant scatterplot is created, and the tendency, average value, and standard deviation of the dialect distribution are calculated using a multidimensional scaling method. Fourth, multivariate analysis of the calculated statistical values is conducted to determine the Euclidean distance matrix (correlation value) and to generate a dendrogram (classification chart) for hierarchical cluster analysis. Additionally, we create a Pareto chart and a proximity cartogram. The dialect distribution statistical analysis method can analyze the similarity between points and identify cluster patterns. It can also analyze interrelationships by measuring the shortest distance between each point and cluster. Furthermore, it is possible to assess the degree of cohesion in the region by calculating the mean and standard deviation of the dialect at the target point. By comparing the average dialect value and the proximity using the cartogram with the dendrogram between points, the correlation between points within the entire dialect area can be analyzed.