L'erreur de Martin Gardner ou l'importance de définir le protocole en probabilités

Publié le 08 février 2011 par Olivier Leguay

Martin Gardner est décédé en mai dernier et laisse derrière lui un nombre considérable de publications, principalement dans le domaine des jeux mathématiques. Il publia pour la première fois le problème des deux enfants dans les colonnes du Scientific American en 1959. Il le republia plus tard dans  The Second Scientific American Book of Mathematical Puzzles and Diversions. La première réponse que donna Martin Gardner était eronnée ou plutôt incomplète. Il rectifia sa réponse dans une autre  édition mais c'est la solution erronée qui est restée plus populaire que la correction. De plus, en 2010, une variante du problème des deux enfants, celle de l'enfant-mardi est apparue et est devenue un sujet "viral" dont la solution proposée présente le même défaut.

On peut certainement faire l'analogie de ce problème avec le paradoxe de Bertrand que j'avais abordé dans un billet précédent.

 

Le problème des deux enfants

Il s'énonce comme suit:

Mr. Smith has two children. At least one of them is a boy. What
is the probability that both children are boys?


Mr. Jones has two children. The older child is a girl. What is
the probability that both children are girls?


Il n'y a pas vraiment de problème en ce qui concerne M. Jones. Même si, comme nous allons le voir, la procédure de récupération de l'information n'est pas précisée, on peut la supposer comme étant très peu ambigüe (en tout cas beaucoup moins qu'en ce qui concerne M. Smith). On choisit une famille  ayant exactement deux enfants (on élimine les jumeaux) dont le second est une fille. Le sexe du premier enfant étant indépendant du sexe du second, on a une chance sur deux que le premier enfant soit une fille (en supposant que la probabilité d'avoir une fille est la même que celle d'avoir un garçon). La probabilité cherchée est donc 1/2.

La solution proposée par Martin Gardner pour M. Smith est la suivante. On se place parmi les familles de deux enfants et ensuite parmi celles dont l'un des deux enfants est un garçon. Il y a trois possibilités avec la même probabilité : le premier est une fille et le second est un garçon, le premier est un garçon et le second aussi, le premier est un garçon et le second est une fille. Il y a donc une chance sur trois que M. Smith ait deux garçons. La probabilité cherchée est donc de 1/3.

Cette solution concernant M. Smith n'est cependant pas correcte car la réponse peut dépendre du protocole utilisé pour obtenir l'information "au moins l'un des enfants est un garçon".

Martin Gardner précisa par la suite pour corriger "... the answer depends on the procedure by wich the information "at least one is boy" is obtained".

Ce problème se pose beaucoup moins pour M. Jones car soit c'est un problème d'indépendance où la question associée à la réponse fournie n'est pas ambigüe (elle pourrait l'être, mais ce ne serait pas très naturel). Ce serait une question du type: "Quel est le sexe de l'enfant le plus âgé?" ou "Quelle est la position du garçon?". Pour la première question soit c'est une fille et il n'y a pas de problème, soit c'est un garçon et la probabilité cherchée est 1/2. Pour ce qui est de la seconde question, soit il répond le plus jeune ou le plus âgé et dans ce cas la probabilité est aussi 1/2. Et s'il n'y a pas de garçon, il n'y a pas de problème.

Retournons donc vers M. Smith et imaginons le protocole qui a pu être utilisé pour obtenir l'information "au moins l'un des enfants est un garçon".

1) On choisit au hasard une famille de deux enfants dont l'un d'entre eux est un garçon. Si M. Smith est choisi au hasard dans cette liste, la réponse est 1/3.

2) On choisit au hasard une famille de deux enfants. Celle choisie est celle de M. Smith. Il doit utiliser le protocole suivant pour délivrer l'information le concernant:

S'il possède deux garçons, il doit répondre "j'ai au moins un garçon".

S'il possède une fille, il doit répondre "j'ai au moins une fille".

S'il possède un garçon et une fille, il doit lancer une pièce de monnaie, si elle tombe sur Face, il répond "j'ai au moins un garçon", sinon, "j'ai au moins une fille".

En représentant cette situation par un arbre pondéré on a la situation suivante :

En utilisant le calcul des probabilités conditionnelles, la probabilité que M. Smith ait deux garçons sachant qu'il  a répondu qu'il en au moins un est égale à la probabilité qu'il ait deux garçons et qu'il ait  répondu qu'il en a au moins un sur la probabilité qu'il ait répondu qu'il en a au moins un, soit: (1/2*1/2)/(1/2*1/2+1/2*1/2*1/2+1/2*1/2*1/2)=(1/4)/(1/2)=1/2.

On pourrait imaginer d'autres protocoles de réponses:

Par exemple celui dans lequel M. Smith répondrait qu'il a deux garçons s'il en a deux et au moins un s'il en a un. La probabilité qu'il en ait deux dans ce cas serait de 0.

Ou bien celui dans lequel il dirait qu'il a au moins un garçon s'il a deux garçons et qu'il est très fier d'avoir une fille s'il en a au moins une. Dans ce cas la probabilité cherchée serait de 1.
Il existe donc de nombreux protocoles dont les probabilités associées au problème initial vont de 0 à 1. Sans spécification du protocole de questionnement, le problème ainsi formulé est ambigu.

Le problème de l'enfant-mardi

Il se formule ainsi:

J'ai deux enfants. L'un est un garçon né un Mardi. Quelle est la probabilité que j'ai deux garçons?

Il est nécessaire de prendre quelques précautions, par exemple , il faut supposer l'équiprobabilité d'avoir une fille ou un garçon, qu'un enfant naisse un jour donné, et qu'on ne considère pas les jumeaux.

Si l'on se place parmi toutes les familles ayant deux enfants et que je corresponde à l'une d'entre elles, on peut appliquer la formule utilisée dans le cas de l'équiprobabilité, en faisant le quotient du nombre de cas favorables par le nombre de cas total. Si l'on considère tous les cas possibles, soit deux genres par enfant et 7 jours d'anniversaire:  il y a 2*7*2*7 soit 196 possibilités. Si l'on se restreint au cas où un garçon est né le mardi:

Le premier enfant est un garçon né le mardi et le second une fille née n'importe quel jour : 7 cas

Le deuxième enfant est un garçon né le mardi et le premier une fille née n'importe quel jour : 7 cas

Le premier enfant est un garçon né le mardi et le second un garçon né un autre jour : 6 cas

Le second enfant est un garçon né le mardi et le premier un garçon né un autre jour : 6 cas

Les deux garçons sont nés le mardi: 1 cas

Il y a en tout 27 cas dont 13 sont favorables. La probabilité cherchée est de 13/27... à condition que le protocole proposé précédemment corresponde à un tirage fait au hasard parmi une liste de fiches disponibles des familles ayant deux enfants dont l'un d'entre eux est un garçon né un mardi. Ma fiche, correspondant aux critères, aurait été tirée par hasard. Dans ce cas j'aurai une probabilité de 13/27 d'avoir deux garçons.

Mais rien n'indique dans l'énoncé que c'est le cas et le protocole pourrait être tout à fait différent comme dans l'exemple précédent.

On peut par exemple supposer que l'on demande à chaque famille de dire une phrase vraie du type "J'ai eu un garçon/une fille le lundi/mardi/mercredi/jeudi/vendredi/samedi/dimanche". On se pose ensuite la question de savoir quelle est la probabilité d'avoir deux garçons, donc en fait que l'autre soit un garçon. On se retrouve dans ce cas dans une situation très simple, puisque les deux naissances étant indépendantes, il y a une chance sur deux que l'autre enfant soit un garçon. La probabilité cherchée est donc 1/2.

On peut considérer un autre protocole qui consisterait à choisir au hasard une famille mais à renvoyer chez elles les familles  tant que l'on en a pas trouvé une ayant au moins un garçon. On lui demande ensuite de dire une phrase vraie du type" J'ai eu un garçon le lundi/mardi/mercredi/jeudi/vendredi/samedi/dimanche" et se poser ensuite la question de la probabilité d'avoir deux garçons. On se retrouve ici dans la configuration du problème des deux enfants avec une probabilité de 1/3 puisque les couples (garçon1, fille2), (fille1, garçon2) et (garçon1, garçon2) sont équiprobables, une fois le couple (fille1,fille2) éliminé. L'information du jour de la semaine est neutre puisque tout autre jour aurait pu être donné.

Il existe comme dans le cas du problème des deux enfants de nombreuses façons d'obtenir l'information. Si l'on veut impérativement que la réponse au problème soit 13/27 et que celle du problème des deux enfants soit 1/3 comme cela est présenté dans un article du New Scientist de Mai 2010, l'ambiguité doit être levée sur la façon dont est obtenue l'information.

La formulation suivante est exempte d'ambiguité:

On choisit au hasard un père de deux enfants exactement (qui connaît leur jour de naissance!) et on lui demande: " Oui ou non avez-vous un fils né un mardi?". Il répond oui. Dans ce cas on peut affirmer que la probabilité qu'il ait deux fils est de 13/27.

Ce billet est tiré d'un article publié sur ArXiv par Tanya Khovanova, mathématicienne et excellent blogueuse.

Pour compléter :

Un portrait de Martin Gardner

Le paradoxe du second as et le sens du conditionnement