Patrick Devedjian, président UMP du Conseil général des Hauts-de-Seine, a déclaré mercredi 9 mai qu'il y avait eu "un vote communautaire" lors de la présidentielle, précisant que, selon une étude, 93% des Français de religion musulmane avaient voté pour François Hollande.
Visiblement ce sémillant président, prompt à adopter une attitude communautaire pour les affaires relatives à l’Arménie ou à la Turquie, n’a pas la moindre idée de ce que sont les statistiques. Je vais donc ici tenter de le lui expliquer. En fait il existe deux branches de la statistique, la statistique descriptive et la statistique analytique.
La statistique descriptive consiste à déterminer les caractéristiques d’une population donnée. Ainsi, lors du dépouillement d’un scrutin, on compte bureau par bureau, les voix obtenues par chacun des candidats et, en les rapportant au nombre de suffrages exprimés, on calcule les pourcentages obtenus. La population correspondante se trouve ainsi décrite. Ce qui est intéressant, c'est que le calcul des probabilités a permis de démontrer qu’à partir d’un échantillon, on pouvait estimer les caractéristiques d’une population donnée et indiquer la précision de cette estimation. Plus l’échantillon est important, meilleure est la précision. C’est cette technique d’échantillonnage qui permet la réalisation de sondages.
Tout l’art de la prévision réside dans la constitution de l’échantillon. Une première méthode est de de le réaliser « au hasard ». La difficulté est qu’il est particulièrement difficile de vérifier si un échantillon résulte bien du hasard. Si, avant une élection, je sonde au hasard des personnes dans la rue ou par téléphone, les résultats seront radicalement différents selon que j’opère, par exemple, dans le XVI° ou dans le XIX° arrondissement de Paris. C’est pourquoi on procède généralement par la méthode des quotas, en constituant un échantillon ayant sur la base de l’âge, de la Catégorie Socio-Professionnelle et d’autres critères, la même composition que la population qu’il est censé représenter.
Mais, au-delà de cette statistique descriptive, on peut aussi faire de la statistique analytique. Celle-ci pose d’autres problèmes qu’avec son parti-pris bien ancré, Patrick Devedjian a complètement ignorés. C’est ce que je me propose d’éclairer demain.