Quiestlemoinscher.com d'E. Leclerc : manipulation de statistiques ?

Publié le 17 octobre 2012 par Copeau @Contrepoints

Les méthodes du site Quiestlemoinscher.com d'E. Leclerc sont celles de la manipulation statistique. Voici comment.

Par Acrithène.

Vous avez sans doute entendu parler de ce site internet, quiestlemoinscher.com, sur lequel l’enseigne E.Leclerc vous propose de se comparer à ses principales concurrentes. En lisant un quotidien gratuit dans le RER, j’ai été surpris par les écarts de prix décrits par la publicité qui s’y trouvait. J’ai aussi été interloqué par la présence de Carrefour Market dans la comparaison. Il m’a semblé qu’on comparait là deux choses sans grand rapport, et qu’il était attendu et logique que les prix de petits magasins de centres villes dépassent largement ceux d’hypermarchés de banlieues et de campagnes.

Aussi me suis-je demander comment était effectuée cette comparaison par un juge et partie. Et j’ai été surpris qu’on laisse vivre une telle manipulation.

Ce qui serait une bonne méthode

Le choix d’une méthode statistique dépend évidemment de la question qu’on se l’on pose, et vous tous qui avez lu des sondages savez que la formulation d’un problème peut cacher un sophisme.

Le site internet d’E.Leclerc pose la question suivante :

  • Quelle marque est en moyenne la moins chère ?

Quant à moi, je prétends que la question qui intéresse le consommateur est plutôt :

  • Dans lequel des magasins auxquels j’ai accès dois-je faire mes courses ?

Pour répondre à cette dernière question, la ménagère compare les magasins proches de son foyer et correspondant à la manière dont elle aime consommer (plutôt en centre-ville, dans de petits magasins ou plutôt dans d’immenses hypermarchés au milieu des champs). Ce qui compte pour elle, c’est qu’à données géographiques et commerciales semblables, telle enseigne soit moins chère que telle autre. Elle se moque des prix de Wal-Mart, car il n’y en pas près de chez elle.

Le souci pour le statisticien honnête est donc que les grandes enseignes ont des implantations régionales et de modes de distribution très différents. Aussi, si on les compare de la manière la plus sauvage, on risque de voir des différences de prix entre marques qui ne sont le reflet que de ses disparités fondamentales et non d’une comparaison honnête fidèle à la différence entre deux magasins comparables et voisins.

Si je me lance dans une étude ethnique (interdite par la loi française) pour déterminer l’intelligence des enfants selon la couleur de leur peau, mes résultats seront fondamentalement biaisés par les différences socio-économiques entre ces groupes, et je pourrais tirer de leurs moyennes au baccalauréat des conclusions génétiques totalement infondées mais en apparence soutenue par l’analyse statistique.

Pour corriger un tel problème, la « méthode des appariements » est appropriée. Je vous l’avais déjà expliquée au sujet du devenir des emplois jeunes. Ici, elle consisterait à sélectionner aléatoirement un échantillon de magasins E.Leclerc, puis, pour chacun, de déterminer les magasins concurrents les plus proches en termes géographiques et les plus semblables en termes de surface marchande. Il conviendrait ensuite de comparer, au sein de chaque sous-groupe, les écarts de prix, et de faire finalement la moyenne des ces écarts à l’échelle nationale. Ainsi la ménagère de la campagne ne choisirait pas E.Leclerc face à Carrefour parce que la plus grande présence de Carrefours en ville accroît le prix moyen national de cette enseigne ; mais parce qu’à situations comparables, E.Leclerc est moins cher que Carrefour.

Que fait le site quiestlemoinscher.com ?

Le site de comparaison d’E.Leclerc fait délibérément le contraire de ce que je viens de vous exposer. Le site propose en effet l’explication suivante :

Les magasins de chacune des 13 enseignes ont été sélectionnés par application stricte de la méthode dite des quotas. Cette méthode consiste à construire pour chaque enseigne un échantillon de magasins de sorte qu’il ait la même structure que celle de la totalité du parc de magasins de l’enseigne. Les deux critères de quotas utilisés dans l’échantillonnage sont la zone géographique (découpage du territoire français métropolitain, hors Corse) et la taille de magasins ventilée en six tranches de surface. Ces deux critères ont été retenus en tant que variables les plus importantes pour expliquer d’éventuels écarts de prix entre magasins au sein d’une enseigne.

Noyé dans le bullshit savant des statisticiens, se trouve l’aveu que la méthode statistique employée, plutôt que de corriger l’étude des différences structurelles entre enseignes, fait tout pour les conserver. C’est comme si, pour estimer la capacité d’un noir à poursuivre des études supérieures, j’avais pris garde à ne sélectionner qu’essentiellement des citoyens africains au prétexte que prendre des européens ou des américains n’aurait pas été représentatif de leur réelle répartition géographique de cette population dans le monde.

Aussi, quand j’étudie le cas de la bouteille de Coca-Cola, je ne suis pas surpris que soient sélectionnés, pour comparaison avec 37 magasins E.Leclerc, 365 magasins concurrents dont plus de la moitié se trouvent dans d’autres départements. Le chiffre de 37 magasins E.Leclerc est aussi surprenant, car la méthodologie du site précise que l’échantillon E.Leclerc comprend 84 magasins, mais que le nombre de magasins varie d’un produit à l’autre selon la présence du produit dans le magasin en question. Je suis surpris que plus de la moitié des magasins E.Leclerc ne semblent pas vendre la bouteille de Coca-Cola 1,5L…

Différences de prix sur la bouteille de Coca Cola 1,5L, d’après E.Leclerc

Or une telle enquête a probablement été confiée à des gens qui connaissent leur métier, et qui plutôt que de corriger des biais évidents, ont choisi délibérément de les conserver. Aussi peut-on dire aussitôt que cette étude est une arnaque manquant cruellement de déontologie.

Une tentative de reconstitution

J’ai donc entrepris de supprimer de la liste tous les magasins concurrents se trouvant dans des départements pour lesquels E.Leclerc ne présente aucun supermarché, ou dans lesquels il ne référence qu’un seul concurrent.

Ensuite, pour savoir si un habitant de ses départements a intérêt à aller acheter son Coca-Cola (le principal élément de mon panier) chez E.Leclerc, j’ai calculé la différence entre la moyenne de la marque dans ce département et son meilleur concurrent.

Bien sûr, il est impossible de reconstituer la méthode des appariements de manière correcte sur la base d’un petit échantillon constitué dans le but inverse. Et le résultat n’est pas à prendre au sérieux, mais il montre cependant qu’entre l’enseigne E.Leclerc et son meilleur concurrent (tel que recensé par E.Leclerc) les écarts sont minces, et qu’il n’est pas si fréquent que vous réalisiez une économie substantielle en vous rendant chez E.Leclerc. Pour un échantillon biaisé en faveur de ce dernier, le résultat n’est pas si convaincant. À ce jeu des petits chiffres, dans les trois départements comprenant un E.Leclerc et un Hyper U, Hyper U était en moyenne 3% moins cher (soit l’inverse de ce que sous-entend le tableau précédent).

Conclusion

Un élément vient cependant soutenir le cas d’E.Leclerc. Si les autres enseignes ne cherchent pas à contester les résultats de comparaisons menées de manières aussi malhonnêtes c’est peut-être qu’elles n’y trouveraient pas tant d’intérêt…Peut-être E.Leclerc est-il effectivement parmi les moins chers, mais, mauvais prince, ne se gène pas pour autant pour manipuler les chiffres.

Pour ailleurs, si le gouvernement en avait le courage, il existe une mesure quasi-gratuite en faveur du pouvoir d’achat qui s’inspirerait de l’initiative d’E.Leclerc. Tous les prix de ses magasins sont stockés informatiquement, et si la loi obligeait les grandes surfaces à rendre publiques leurs bases de données de prix, il serait fort aisé pour quelques informaticiens bien intentionnés de publier des applications de comparaison. A coup sûr cela ferait pression sur les marges des distributeurs.

---

Sur le web