Interlude ( suite 4) : BAYES et ses défauts

Publié le 14 novembre 2016 par 000111aaa

Soyez surs, chers lecteurs   que cette déroute des sondages  USA , ses prix budgétaire et politique  vont secouer le cocotier  dans le  milieu des sondeurs et des statisticiens ! C’est pourquoi  je vais vous parler aujourd’hui  de probabilités bayésiennes … JE LE FERAI EN TERMES SIMPLES et nous reviendrons ensuite en voir les  conséquences sur le plan d’échantillonnage puis sur   les critères de redressement

_______________________________________________

-« Lorsqu’ un sondeur interroge un électeur  sur son vote futur  pour   des candidats A ou B  , la réponse de ce dernier ne peut être que vraie ou fausse !Il ne peut y avoir d’autre alternative ….D accord ?

-«  Non OLIVIER ! l’électeur  sondé  peut  aussi  répondre  :je ne voterai pas / je ne sais pas encore  pour qui je voterai/  je voterai pour les 2/ je voterai pour A (ou pour B)  sI  telle occurrence se produit d’ici là ………

-«  Alors moi je traduis votre réponse  en :abstention/incertitude/vote nul /vote conditionnel   !  Mais même ce type de réponse  ne  peut être  que  vrai ou faux ….D’accord ? Ce  qu on appelle règles d inférence  bayésienne ne fait intervenir que ces deux valeurs vrai ou faux

-« Oh ! Je craignais plus de  complication ! Où m’entrainez-vous ?

-« Encore bien plus loin  car   dans la catégorie « incertitude »   , d’autres  paramètres  interviennent  que je traiterai  plus  tard  .Tout d’abord une analyse bayésienne demande au départ une première modélisation  des connaissances de l’échantillonnage électoral « primitif »…Cette information « floue » de départ est ensuite affinée par des observations additionnelles grâce à la loi de Bayes .

-«  Ou les trouve- t-on ces connaissances ? Au téléphone,   le face à face ,internet etc. ?

-«   Oui ! Mais concrètement on interroge  d’abord  pour   se servir  aussi  des   votes précédents   des électeurs  sondés ……

-« Ils peuvent mentir sur leurs déclaration  de leurs  votes  passés également  … Non ?

-« C’est vrai  , c’est pourquoi  le raisonnement bayésien   doit confronter   les déclarations  et les  votes  passés effectifs ….

-«   Tout cela est  vague ,OLIVIER, rentrez dans le détail !

_________________________________________________

-« Prenons votre hypothèse de mensonge   inférant  sur le plan d’échantillonnage primitif.. Un 1er redressement  consiste à essayer de corriger les mensonges des sondés.  Peut être les personnes interrogées n’oseront pas dire qu’elles voteront pour un candidat d’extrême-droite ou d’extrême-gauche….. Ou au contraire qu’elles  sont «  moutonnières » et ont  voté  pour  le parti ou le président qui a eu le pouvoir  jusque-là !… . Ainsi, si un parti politique a obtenu 20% des suffrages à l’élection présidentielle précédente  mais que seules 10% des personnes interrogées admettent avoir voté pour le candidat  à cette élection, on estime que le vote est sous-estimé de moitié. Les intentions de vote pour le parti dans le sondage seront donc  à multiplier  par deux ….  ou au contraire il faudra  commencer  une  pondération s’ il a eu des effets «  d’ emballement » précédemment …..

 -«  Comment çà ?

-« L’effet « bandwagon » désigne  l’effet mobilisateur pour la campagne d’un candidat lorsque celui-ci es allègrement  en tête dans les sondages….mais  à contrario l’effet « underdog »désigne, lui, l’effet inverse à savoir la mobilisation des électeurs en faveur du candidat à la traine dans les sondages et  dont  le « tempérament » s’est brusquement réveillé….

-«  Est-ce  la seule « stratégie » ?Peux-t-on éliminer les sondés qui mentent  et comment faire ?

-«  I ’institut de sondage doit rester dans son budget et  une fois qu’ il a éliminé  les abstentionnistes déclarés  il dispose de méthodes de filtrage…Toutefois, Celles-ci amènent des correctifs  malaisés ;   que faire par exemple  de ceux qui, tout en affirmant leur intention de participer au scrutin, signalent que leur choix peut encore changer ? La situation de doute va-t-elle les conduire à l’abstention ?  Comment  l’évaluer ? Le sondeur ne peut rentrer  dans une enquête de police (avec détecteur de mensonges !) ou de nature psychologique   !…Seule   lui reste   la finesse de son  questionnaire   qui lui permet d’apprécier si  ce type d’électeur incertain appartient à des tranches de la population, un peu plus abstentionnistes que la moyenne. ….etc.

-« Est il possible par ailleurs OLIVIER que les sondages à leur publication  puissent avoir un impact sur les choix et décisions des citoyens. ?

-«  Bien entendu !Mais   c’ est une évaluation difficile ..Je vous en ai cité déjà deux  ….Mais la perversion des partis  ,des groupes de pression  et des média associés est parfois grande ! On parle alors de l’effet « humble-the-winner » (littéralement : « humilier le gagnant ») qui désigne la démobilisation des troupes d’un candidat depuis longtemps  en tête des intentions de vote et de  l’effet « snob-the-looser » (« snober le perdant ») qui désigne, elle,  forcer la démobilisation des troupes du  perdant quasi –certain  dans les sondages.

-« Comment évaluer  tout cela?

____________________________________________________________

Rentrons alors   encore un peu plus dans le petit détail d’un  sondeur  utilisant la  procédure  BAYES  pour déterminer le choix  d’un électeur X  partagé entre   deux partis en présence  A et B  ( on élimine les extrêmes)

 Un sondeur dispose sur le suivi du  fichier de cet électeur   X   déjà  par exemple  de  quatre résultats précedants TOUJOURS déclarés   pour A …..X va-t-il continuer   à voter pour A ? Réponse de X :oui ou non …..

On ne peut traiter l’électeur  X  comme une pièce de monnaie tombant sur pile ou face   et dont  le résultat est aléatoire ……Si X a voté pour A  quatre fois , il ne l a pas fait par hasard , en tirant à pile ou face  !Et si la distribution est de 4  fois A  et deux fois B  une analyse complémentaire s impose .....

 En cas de  réponse  4fois  A (oui) de X  ,le sondeur ne peut  donner une fiabilité certaine à  ce 5 ème  oui !

Mais rappelons que le sondeur est libre dans le choix des sondés   , donc il peut   soit enregistrer  son   oui   soit changer de sondé ….

Il peut aussi continuer  de re- questionner son sondé X  jusqu’au vote  , pour  confirmer le oui …. à mesure que le nombre d'observations devient grand il existe un  psi-test bayésien qui est utilisé pour déterminer la plausibilité d'une variation  par rapport à des observations)   … Et pour ceux   qui  l’ont utilisé   cela ressemble au test de  χ² des statistiques classiques.

 A suivre

 .

,