Université de Franche-Comté

L’écriture SMS décryptée par les scientifiques

C dans l’R… les SMS représentent un mode de communication à part entière, hors des normes de l’écrit usuel, utilisant des codes spécifiques aux variations multiples. C’est pour mieux décoder et analyser ce langage que se constitue en Suisse, sous l’impulsion d’une idée née en Belgique, un grand corpus de SMS.

 

 

Des millions de SMS sont échangés chaque jour par portables interposés. Ce nouveau mode de communication écrite a déjà fait couler beaucoup d’encre, inquiétant les uns quant à un appauvrissement possible de l’orthographe chez les plus jeunes, mais émouvant peu les autres, qui voient là un retour salutaire à l’usage de la langue écrite.

 

Une langue écrite assez nouvelle et originale pour intéresser les scientifiques et donner lieu à une vaste collecte d’informations, matière à analyses et interprétations. La volonté de constituer un corpus de SMS s’est d’abord affirmée en Belgique, à l’université catholique de Louvain, où pas moins de 75 000 SMS ont été recueillis en deux mois lors d’une étude menée en 2004. Depuis, toujours sous l’impulsion de Louvain, l’idée a fait son chemin et gagné des universités en Angleterre, en France (Poitiers, Montpellier, Rennes, Grenoble, la Réunion), en Espagne, en Italie, en Grèce et au Québec. En Suisse, l’étude en est encore à ses débuts, mais la collecte des données a été réalisée en fin d’année 2009. 24 000 SMS constituent désormais la base d’un travail immense pour les linguistes des universités de Neuchâtel et Zürich.

 

 

Les langues gréco-romaines aussi aimaient les abréviations

À Neuchâtel, Marie-José Béguelin évoque le projet avec enthousiasme. « C’est une excellente initiative car nous manquons de grands corpus autres que littéraires pour l’analyse de la langue, comme des données orales, des correspondances, des copies d’élèves… ». Ou des SMS ! La professeure de linguistique française se passionne notamment pour les procédés abréviatifs utilisés dans ces échanges, à l’instar de ceux mis en place par les langues gréco-romaines ou d’autres langues anciennes. Si elles ne sont pas l’apanage de cette communication, les abréviations sont légion dans les cohortes de textes reçus. À côté de la phonétisation de certaines graphies, Ki pour qui ou kom pour comme, les lettres elles-mêmes prennent une valeur épellative : G pour j’ai ou tu mm pour tu m’aimes.

 

Les chiffres possèdent aussi cette valeur et se combinent à l’alphabet pour énoncer des phrases en quelques signes. À un de ces quatre se résume en la formule lapidaire A12C4. Les signes de ponctuation sont exploités graphiquement et deviennent « émoticons », comme dans les chats sur internet. Ainsi ; – ) exprime sans équivoque pour les initiés la joie ou la bonne humeur.

 

 

Tu fais quoi morgens ?

En Suisse, la particularité née du voisinage de quatre langues nationales devient un véritable casse-tête pour les analystes. Français, allemand, italien et romanche se combinent dans les SMS et la volonté d’opérer des tris en fonction des langues demande une méthodologie très fine pour élaborer des logiciels fiables, capables d’identifier la langue utilisée. Le mot merci est un emprunt au français couramment répandu en Suisse allemande et ne constitue donc pas une preuve d’utilisation de la langue française. Le recours aux dialectes brouille également les données. Un vrai jeu de piste linguistique auquel sont confrontés les spécialistes. L’étude comparative entre les quatre langues est inscrite au programme des analyses à venir, conjointement à celle des codes et des caractéristiques propres à la communication par SMS. L’ensemble fera l’objet de la rédaction de mémoires et de thèses à l’université de Neuchâtel. A12C4 pour la lecture des premiers résultats !

 

 

Emoticon

 

 

 

Donnez vos SMS à la science !

 

Nombreux sont les « fanas » de textos à avoir répondu à l’appel lancé par les universités de Neuchâtel et de Zurich. Les participants redirigent leurs écrits via un opérateur de téléphonie mobile mettant gratuitement un numéro à disposition pour ce transfert. Une gratuité cependant uniquement réservée à ses abonnés, ce qui a pu décourager d’autres utilisateurs de portables. Des tirages au sort prometteurs de cadeaux du type « un i.phone gagné par semaine » ont donné un aspect ludique et motivant à la campagne. À l’arrivée, toutes les données sont anonymisées. Garantie de la protection de la vie privée oblige, les noms des utilisateurs sont interchangés dans le respect d’une consonance de langue ou de nationalité, afin de garder un caractère identitaire aux messages. Un questionnaire préalable à la transmission des SMS a permis sur internet de recueillir des informations sur les participants, autorisant pour l’avenir le croisement des données à un profil sociolinguistique.

 

Comme toute enquête de ce type, l’étude menée ici avec la plus grande rigueur scientifique possible posera forcément ses limites. Elle n’en constituera pas moins la première recherche linguistique d’envergure sur le sujet.

 

 

 

 

En Belgique, 75 000 SMS ont été récoltés auprès de 3 200 participants durant les deux mois de l’enquête menée en 2004. Leur analyse a fait l’objet de deux publications : SMS pour la science (Base de données de 30 000 SMS et logiciels de consultation) et Le langage SMS (Étude d’un corpus informatisé à partir de l’enquête « Faites don de vos SMS à la science »). C. Fairon, J. Klein et S. Paumier ; édités aux Presses universitaires de Louvain, 2006.

Couverture du livre : Le langage sms         Couverture du livre : SMS pour la science

 

 

Contact : Marie-José Béguelin

Chaire de linguistique française

Université de Neuchâtel

Tél. (0041/0) 41 32 718 17 72

 

Retour en haut de page

 

 

retour