Magazine Insolite

La loi de Zipf

Publié le 17 septembre 2015 par Didier Vincent

Le langage a ses propres lois, et qui vous dépassent. Vous pouvez écrire n'importe quoi, il retombera sur ses pattes, lui. Pas vous. Car vous êtes en devenir, sans cesse, un être que le temps tour à tour tisse et déconstruit, enchâsse et détruit. Le langage est historique également, mais tel un glacier, ses structures de peuplement sont lentes, quasi figées. Vous êtes dedans comme dans une forêt (les mots) dont vous ne sortirez jamais. Le désert, c'est l'absence de mots.

Chacun est formé d'un nuage de mots, plus ou moins étendu : quatre cents, grosso modo à l'oral, guère plus. A l'écrit, sans doute plus étendu. Quand on scanne le discours d'un individu, on y retrouve les mêmes mots, les bases autour desquelles s'enroule l'ADN discursif. A les comptabiliser, on obtient un rangement vertical du mot le plus fréquent au mot le plus rare. Cette "loi" de fréquence est détaillée dans cette vidéo : c'est la loi de Zipf. Quoi que vous disiez ou écriviez, votre timbre, votre empreinte linguistique se déploirea autour du même algorithme d'utilisation des mots. C'est structurel. Dans une forêt, vous ne pourrez jamais courir en ligne droite.

20% des mots que vous employez constituent 80% de votre discours. C'est la loi de Pareto. (Elle est bien connue dans les médias sociaux où, sur Twitter par exemple, 20% des utilisateurs génèrent 80% du trafic.) C'est la canopée discursive, l'interface au monde, le chemin que tout le monde emprunte dans la forêt.

A l'opposé, l'hapax legomenon est le mot en bas à droite du graphique. Il n'apparaît qu'une fois et une seule. Le nombre l'hapax varie, lui, d'un livre à l'autre. Chez Rabelais "la dive bouteille", dive est un hapax. Plus près de nous, le mot "abracadabrantesque" utilisé par Jacques Chirac. Ces mors rares induisent un effort de compréhension et d'interprétation. Ils sont souvent un procédé de mise en valeur ou traduisent la richesse ibntellectuelle du locuteur.

Dans la courbe de Gauss du locuteur le plus pauvre (moi par exemple), à celui le plus riche : Proust ou Joyce, la loi de Zipf est la même qui définit les satistiques d'appartion globale des mots.

(Podcast intéressant qui mériterait d'être sous-titré en français.(


Retour à La Une de Logo Paperblog

A propos de l’auteur


Didier Vincent 10389 partages Voir son profil
Voir son blog

l'auteur n'a pas encore renseigné son compte l'auteur n'a pas encore renseigné son compte

Magazine