Pour comprendre les méthodes de sondages d’opinion il me semble maintenant nécessaire de vous faire d’abord un petit cours de statistiques basiques …..Et peut -être faut -il avoir été soit même sondé et sondeur une fois dans sa vie : ce qui a été plusieurs fois mon cas !!!
---------------------------------------------------------------------------------
Chez nous il existe une loi qui en précise les modalités . La loi du 19 juillet 1977, telle que modifiée par celle du 25 avril 2016, comprend une définition stricte du sondage. "Un sondage est une enquête statistique visant à donner une indication quantitative, à une date déterminée, des opinions, souhaits, attitudes ou comportements d’une population par l’interrogation d’un échantillon."
Mais cette loi « rentre » dans le sujet en développant les points nécessaires de traitement ; j’en extrait les quelques caractéristiques que je vais traiter :
-1 : Le nombre de personnes interrogées ( en stats , on parle de la « taille de l’échantillon »)
-2 :La méthode selon laquelle les personnes interrogées ont été choisies, l( en stats ,pourquoi tel choix et pourquoi telle composition de l’échantillon)
-3 :Les conditions dans lesquelles il a été procédé aux interrogations (sondage visuel ou anonyme internet ,téléphone fixe ou mobile , courrier , etc. ( Avec ,s’il y a lieu, la nature et la valeur de la gratification perçue par les personnes interrogées)
-4 :La proportion des personnes n’ayant pas répondu
-5 :La ou les dates auxquelles il a été procédé aux interrogations
-6 :Le texte intégral de la ou des questions posées
- 7 :Les marges d’erreur des résultats publiés ou diffusés, le cas échéant par référence à la méthode aléatoire
-8 :Et l’un des points majeurs des biais et des erreurs : s’il y a lieu, les critères de redressement des résultats bruts du sondage.
ETC.
----------------------------------------------------------------------------------------
-Et maintenant penchons-nous sur cette présidentielle US qui nous a TOUS tant surpris …..Et interrogeons ces paramètres !
1/ Si vous vous référez aux conditions de la consultation américaine publiée ici hier , vous verrez que l’effectif varie entre 447 et 70194 mais tourne en gros autour de 1000 personnes ;le budget pourra alors se révéler très différent !
2 et 3/j’ai choisi dans cette liste trois types de firmes très différentes et correspondant à des tailles d’échantillon volontairement très différentes.
La première est notre célèbre institut de sondage d’origine française , IPSOS, devenue le 3 ème mondialement ,et qui a été sollicité par REUTERS pour des effectifs d’échantillon de l’ordre de 2000 et depuis la fin des années 1980, c'est le téléphone et internet qui sont utilisés( en France)…. La consultation de leur site pour cette présidentielle m’a fait découvrir qu’ il travaillait selon la statistique bayésienne dont je vous ai déjà expliqué les règles ici (on part d’une première information vraie mais ancienne dont on affine progressivement l’évolution : c’est à dire que les sondeurs composent leurs échantillons en se basant sur les électorats X ou Y tels qu'ils apparaissaient lors des précédentes élections…..
La seconde est celle qui correspond à la population la plus nombreuse ( 78000) , c est NBC NEWS le demandeur et Survey monkey l’exécutant ….Voici ce qu’ ils ont bien voulu indiquer sur leur méthodologie ( copier – coller partiel en anglais ,c ar je ne veux pas risquer une traduction imparfaite )
“ The NBC News|SurveyMonkey Weekly Election Tracking data for the week of October 31 through November 6, 2016 was conducted online among a national sample of 70,194 aged 18 and over who are likely to vote. Respondents for this survey were selected from the nearly three million people who take surveys on the SurveyMonkey platform each day. Data for this week has been weighted for age, race, sex, education, region, and voter registration status using the Census Bureau and Bureau of Labor
Statistic’s
“ Current Population Survey to reflect the demographic composition of the United States. An additional smoothing parameter for ideology based on previous Election Tracking interviews is included. The smoothing parameter was derived from aggregated data on ideology by region collected from previous weeks (May 1-June 26) of the Weekly Election Tracking poll. Because the sample is based on those who initially self-selected for participation rather than a probability sample, no estimates of sampling error can be calculated. All surveys may be subject to multiple sources of error etc “
La troisième m’a plu par la clarté de ses explications et je vous les livre en copier-coller partiel : « November 7 (Bloomberg) -- The Bloomberg Politics Poll, conducted Nov. 4-6 for Bloomberg Politics by Selzer &
Co. of Des Moines, IA, is based on interviews with 799 U.S. adults ages 18 or older who say they will definitely voteor have already voted in the 2016 general election.
Interviewers with Quantel Research contacted 982 U.S. adults with randomly selected landline and cell phone
numbers supplied by Survey Sampling International. Responses from the full probability sample were weighted byage and race to reflect the general population based on recent census data. Interviews were administered in English.
---------------------------------------------------------------------
Mais arrivé à ce point MONSIEUR TOUTLEMONDE , mon lecteur habituel , se réveille pour me passer un sacré savon ! « Franchement OLIVIER s il faut devenir expert en traduction de statistiques en américain pour arriver à vous comprendre , vous commencez à exagérer ! Dites nous , bon sang et en langage clair , pourquoi tous les instituts de sondage avec un échantillon de 78000 ou de 1000 se sont si formidablement trompés !???
-« Du calme ! Du calme ! il faut en effet une analyse encore plus fine ……
A suivre
,