원문정보
Sud4science, the Acquisition of a Large Corpus of French SMS to Analyze SMS Writing
초록
영어
This article describes the sud4science project (www.sud4science.org). Firstly, the authors present the acquisition phase of both SMS data and questionnaire data. Secondly, they explain anonymisation techniques, transcoding and optional annotation phases. Finally, they propose preliminary (socio-) linguistic analyses of scriptural usage of SMS writing, and they also indicate those that are planned in the foreseeable future.
기타언어
Dans le cadre de cet article, on expose le déroulement du projet sud4science (www.sud4science.org). En premier lieu, on décrit la phase d’acquisition des données en provenance des SMS et du questionnaire, avant d’aborder les étapes successives d’anonymisation, de transcodage et d’annotation optionnelle. Ensuite, on présente les analyses (socio-)linguistiques des pratiques scripturales de l’écriture SMS (eSMS) qui ont débuté, ainsi que celles prévues à court et à moyen terme.
목차
1. Acquisition des données
1.1. Résultats préliminaires du questionnaire
2. Anonymisation, transcodage, annotation
2.1. Système d’anonymisation
2.2. Transcodage et annotation
3. Analyses (socio-) linguistiques
3.1. Analyses des SMS
3.2. Liens entre SMS et données du questionnaire
Conclusion
Remerciements
Bibliographie
[Résumé]
[Abstract]