Extrait du site
Depuis peu, les industries de la langue s’intéressent également à ce phénomène et tentent d’adapter leurs outils, conçus pour le texte classique, à ces messages courts (filtrage, classification thématique, traduction automatique, recherche d’information, etc).
Une difficulté se présente quand on cherche à mener une étude dans ce domaine : c’est l’absence de tout corpus de référence. Un tel corpus est nécessaire pour envisager des études linguistiques de grande envergure et pour permettre de nouveaux développements dans le domaine du TAL (Traitement Automatique du Langage). C’est à ce besoin que notre projet tentera de répondre.
La tâche est d’autant plus hardue que ce langage évolue en fonction de nouvelles expressions, de nouveaux émoticones, des simplifications, abréviations, termes anglais et en plus pour la Réunion de mots ou d’expressions en créole. On peut atteindre pour certains mots 40 variantes possibles. Certains se sont déjà aventurés dans le concept d’analyse du contenu du SMS pour proposer une annonce en fonction du contenu du message mais à mon avis pour que ce soit parfait il y a encore du chemin d’où l’apparition de ce genre d’études. D’autres applications d’utilité publique peuvent tirer parti de ce corpus de référence, je pense notamment aux synthétiseurs vocaux permettant aux aveugles d’entendre un message SMS.
Quelques termes ayant un nombre de variantes assez importants tirés d’un extrait de SMS pour la science :
aujourd’hui
0jourd8; ajd; ajd’hui; ajdi; ajdui; ajord; auj; aujo; aujord’hui; aujourd hui;
aujourdhui; aujourdui; oj; ojd; ojdui; ojoud8; ojourd ui; ojourd’8; ojourd’hui;
ojourd8; ojourdhui; ojourdui; ojrd8
j’espère
g-sper; gsper; gspere; gspr; gspèr; gspère; j esper; jesp; jesper; jespere; jespr;
jespèr; jespère; jespér; jpr; jsp; jspr; jspre; jèesp; jèspèr; jèspér; jésper; jéspèr;
jéspér
j’étais
g t; g tai; g’t; gt; gtais; gto; gtè; jetai; jetè; jt; jtè; jétai; jétais; jétè; jété
je suis
I’m; ch’ui; chui; chuis; chwi; gsuis; ik ben; js8; jss; jsui; jsuis; jswi
je t’aime
I t’m; chtaym; chtm; g t m; gtm; i lov u; jet’aime; jetaim; jetaime; jetm; jt; jt
aime; jta; jtaim; jtaime; jtem; jtm; jtmm; jtèm; taim; ze tem; ztèm
merci
cimèr; mci; meci; mer6; merchi; merciii; mici; mirci; mrci; mèr6
Quelques exemples de SMS cités sur le site de l’étude à la Réunion (mélange français, anglais créole) :
bone ané ma sinoize
Jvien pacé tacaz mé yavépa 2lumiér danta chambr
T g ma 1ère heur 2 conduite a 18h, auj
miaou pour mi aim aou
Vs pouvé vnir si ca vou di sinon see you aswar
Put1 pour moi c bon chui en vacance
Pour ceux qui sont allergiques aux langages SMS, les synthétiseurs vocaux ou des traducteurs pourraient dans un avenir proche faire partie des options par défaut d’un grand nombre de modèles de téléphones mobiles. A noter que les synthétiseurs vocaux équipent déjà certains modèles.