초록 열기/닫기 버튼

본 논문에서는 의미 연구를 위한 다자간 구어 담화 연구에 활용될 수 있는 프랑스어 구어 말뭉치 구축 방식을 제안한다. 이 방식은 주석 도구인 트랜스크라이버(transcriber)로 구축된 원자료를 엘란(ELAN)으로 변환시킨 후 재전사하는 방식으로, 트랜스크라이버에서 주석하기 어려웠던 휴지부나 동시 발화, 래칭(latching) 등 발화 순서와 관련된 현상들을 표현할 수 있다는 장점이 있다. 본 논문은 다음과 같이 구성된다. 1절에서는 연구 목적을 간단히 소개하고, 2절에서는 의미론에서 구어를 연구해야 하는 필요성에 대해 살펴보겠다. 이제까지 의미론을 비롯한 언어학 연구는 주로 문어를 중심으로 이루어져 왔으나 프랑스어를 제대로 이해하기 위해서는 문어와 구어를 아우르는 언어학 연구가 필요하며, 본 절에서는 이러한 주장을 뒷받침하는 여러 논거들을 제시하겠다. 3절에서는 구어 연구에서 말뭉치가 차지하는 의미를 살펴보고, 4절과 5절에서는 본 연구에서 제안하는 엘란을 활용한 프랑스어 구어 말뭉치 구축 방식을 소개하겠다. 특히 5절에서는 담화 의미 연구를 위해 본 연구에서 고안한 구어 전사규범을 소개하도록 하겠다.


Dans la présente étude, nous proposons de construire des corpus oraux en ayant recours à l'outil numérique d'annotation et de transcription ELAN. Pour ce faire, nous avons procédé à la conversion des données annotées de Transcriber vers ELAN. Ce dernier permet de représenter plus correctement les phénomènes linguistiques liés aux tours de parole et à la prosodie. Nous présentons et expliquons également les conventions de transcription que nous avons élaborées pour les recherches sémantiques et avons appliquées à la construction du corpus oral. Nous avons pris en compte les cinq facteurs principaux : le type de transcription, la prosodie, la prononciation, les tours de parole et l'écoute. Ces conventions représentent les énoncés en orthographe standard sans ponctuation. Elles disposent de l'alphabet SAMPA (Speech Assessment Methods Phonetic Alphabet), un ensemble de caractères phonétiques basés sur UNICODE, qui se codent et se décodent plus efficacement sur ordinateur que l'API.