L'objectif de ce billet est de se demander s'il peut exister une théorie générale des questions "Pourquoi?", ou de l'explication en général, de montrer que des philosophes et des scientifiques s'intéressent à cette question, et d'essayer de comprendre en quels termes est-ce qu'elle peut se formuler, quelles sont les difficultés liées à son élaboration. On ne pourra bien sûr pas traiter la totalité de ce sujet dans un simple billet de blog, compte tenu de l'ampleur de la tâche, de sa difficulté, du fait que l'on ne dispose certainement pas actuellement des bases théoriques suffisantes et aussi, signalons-le, des limites vite atteintes de l'auteur!
Les questions "Pourquoi?"
Lorsque l'on demande à Teddy et Valentin, "Pourquoi les léopards ont-ils des tâches?", voilà ce qu'ils répondent:
L’histoire se passe dans la jungle, en Afrique. Nous sommes le 31 mars, avec trois meilleurs amis. Il y a Benji, un jeune léopard sans tâches, Chita et Kikou, ses deux amis singes. Comme chaque jour, ils jouent à trap-trap et à courir dans la jungle. Chita et Kikou adorent se cacher ou se percher dans les arbres. Mais Benji a beaucoup plus de mal pour les attraper. Eux, ils sont habitués à grimper et à sauter d’arbre en arbre. Pour Benji, il faut courir plus et user beaucoup d’énergie pour grimper dans l’arbre où se trouvent ses amis.
Chita et Kikou, très farceurs, décident de faire une farce à leur ami pendant sa sieste. Ils lui mettent des tâches de peinture noire sur son pelage. Benji se réveille et ne remarque rien. Il part à la recherche de ses amis. Mais il se pose des questions : « Pourquoi tout le monde me regarde et rie quand je passe ? » Arrivé au bout de la jungle, il retrouve Chita et Kikou. Ils tiennent un bout de miroir et se tordent de rire. Benji sursaute de peur quand il se voit avec son pelage tout tacheté de noir. Il comprend pourquoi les habitants rigolaient. Voyant leur ami triste, Chita et Kikou disent : « Poisson d’avril ! » Chose qu’ils ne savent pas, c’est que c’est de la peinture indélébile. Du coup, Benji rit aussi, il aime son nouveau look. Surtout depuis que les jeunes léopards l’admirent ! Voila pourquoi les léopards ont des tâches. On trouvera d'autres réponses d'enfants à la question "Pourquoi?" ICI.
Lorsqu'on pose la même question au scientifique voilà l'un des éléments principaux de la réponse qu'il propose, et l'on est bien loin de celle de Teddy et de Valentin:
Une réponse intermédiaire entre le conte et la modélisation mathématique, serait le récit du vulgarisateur:
Ce qui est étonnant et remarquable, c'est que l'équation mathématique montre que les différents motifs de pelage dépendent seulement de la grosseur et de la forme de la région où ils se développent. Autrement dit, la même équation de base explique tous les motifs. Mais alors, pourquoi les tigres et les léopards ont-ils des motifs différents puisque leurs corps sont très similaires ? Parce que la formation des motifs ne se produirait pas au même moment durant la croissance de l'embryon.
Dans le premier cas, l'embryon serait encore petit et, dans l'autre cas, il serait déjà beaucoup plus gros. Plus précisément, l'équation montre qu'il ne se forme pas de motif si l'embryon est très petit, qu'il se forme un motif rayé si l'embryon est un peu plus gros, un motif tacheté s'il est encore plus gros, et ... aucun motif s'il est trop gros !
Voilà pourquoi la souris et l'éléphant n'auraient pas de taches !
A travers cette question, il semble flagrant que la question du "Pourquoi?" est relative, que la connaissance de l'interlocuteur est fondamentale. Une théorie du "Pourquoi?" pourra-t-elle se constituer indépendamment de celui-ci?
Un autre type de question va faire apparaître une nouvelle difficulté. Par exemple on peut se demander: "Pourquoi Adam a-t-il mangé la pomme?"
La première idée qui viendrait à l'esprit est de considérer que cette question est du domaine religieux et qu'elle ne trouvera aucune réponse. Si cette remarque est vraie et renvoit la problématique vers la construction des mythes fondateurs, il n'en reste pas moins que si l'on tente d'y répondre, force est de constater que son ambiguité n'est pas religieuse mais, bel et bien, sémantique.
On peut en fait répondre à "Pourquoi Adam a-t-il mangé la pomme?". La problématique implicite étant de répondre à la question "Pourquoi lui?".
On peut aussi répondre à "Pourquoi Adam a-t-il mangé la pomme?", la problématique implicite étant maintenant de savoir pourquoi cette action a été réalisée et non une autre, comme l'écraser, la donner, la cacher.
Il reste une dernière interrogation du type "Pourquoi Adam a-t-il mangé la pomme?", sous entendu, pourquoi ce fruit, pourquoi un fruit?
Contrairement à l'exemple précédent où la connaissance de l'interlocuteur avait une place capitale une fois que la question était posée, dans ce cas présent, c'est la question elle-même qui peut être ambigüe, trop lâche. Il paraît donc important de se prémunir devant ces ambiguités en formulant une question "Pourquoi?" satisfaisante permettant d'assurer une réponse pertinente. Il est important de connaître l'angle d'attaque de la réponse satisfaisante. Mais est-il possible de construire ce type de questions? Là aussi c'est un point incontournable de la possibilité de formuler une théorie du "Pourquoi?".
Dans le domaine mathématique, des questions "Pourquoi?" peuvent aussi apparaître, comme par exemple :
Le problème qui se pose ici est encore d'un autre niveau que les deux précédents. Il s'agit de comprendre que ce n'est pas parce qu'une chose est vraie et qu'elle est prouvée, qu'elle est expliquée. Le résultat énoncé plus haut est vrai mais la question est de savoir "Pourquoi est-ce que c'est Pi/4 qui se trouve à droite de l'égalité et pas un autre nombre?", sous entendu quel est le lien explicatif entre le membre de gauche et celui de droite? On va donc voir arriver un gros problème avec le statut de la démonstration mathématique et du calcul. Démonstrations et calculs ne sont pas tous explicatifs. La démonstration, le calcul ne répondent pas de façon inconditionnelle à la question du "Pourquoi?". Dans le champ des mathématiques, une théorie du "Pourquoi?" ne pourra pas se contenter de l'existence d'une démonstration valide ou d'un bon calcul.
Si l'on reste dans le domaine des mathématiques, un autre type de question "Pourquoi?" pose problème. C'est celle qui demande pourquoi est-ce que l'on fait tel type de chose pour faire une démonstration? Par exemple "Pourquoi introduire la fonction "machin" pour démontrer le résultat "truc"? Et le professeur de mathématiques ne s'y trompe pas car sa réponse est presque toujours invariable même si elle n'est en rien explicative "On fait ça parce que ça marche!". On voit donc bien qu'il y a là une difficulté réelle qui aborde la naissance des idées, la justification de l'intuition, la justification d'une étape "deus ex machina".
D'autres questions "Pourquoi?" peuvent aussi s'avérer problématiques, comme par exemple: "Pourquoi JFK est-il mort le 22 novembre 1963?". Une fois levées les ambiguités de la question sur les attentes (JFK, mort ou date), il est ici question de l'explication historique. L'histoire ne se répétant pas, peut-on concevoir une "explication historique". L'explication relevant principalement de la rationnalité et de la science, n'est-on pas dans l'incapacité d'expliquer l'histoire, sauf à la considérer comme science, ce qui n'est pas sans apporter un autre lot de difficultés?
Les questions exclusivement scientifiques ne sont pas non plus sans poser de problème!
Y a t'il une meilleure explication que les autres à cette question : "Pourquoi aucun observateur ne peut se déplacer plus vite que la lumière ?" ?
"Pourquoi les lois de Kepler sont-elles valides ?" Le "vrai" physique, comme nous l'avons vu juste au dessus, n'épuise pas à lui seul la question du "pourquoi".
Derrière ces quelques "questions-pourquoi", nous voyons pointer la difficulté de concevoir une théorie qui permettrait d'englober toutes les réponses possibles et de sélectionner parmi elles, celle qui est la plus pertinente. Cette théorie devra de plus nécessairement contenir les "questions-pourquoi" des mathématiques. La réponse au "Pourquoi?" se devant d'être explicative, il faudra se confronter à la nature de l'explication qui soulignons-le, ne peut pas éliminer le récepteur, introduisant ainsi une forte part de relativité, bien inconfortable en sciences par exemple.
Pouvons-nous concevoir une théorie du "Pourquoi?"? Est-il possible de la mathématiser, et est-elle compatible avec les mathématiques? Pour préciser les choses , la théorie des questions-pourquoi impose que le particulier puisse se déduire de la règle. Cela exige aussi de savoir s'il est possible de lever toutes les ambiguïtés associées à ce type de question, comme nous pouvons le constater dans les questions sur Adam et la pomme. Il faut aussi se poser la question, si l'on choisit d'associer la meilleure explication à la meilleure probabilité de certitude, de savoir si la démonstration mathématique (de probabilité 1) est toujours explicative. Il faut aussi se poser la question de savoir si l'on parvient à expliquer le "Pourquoi faire cela?" en vue d'une démonstration, plutôt qu'autre chose, mettant ici de l'arbitraire là où il ne devrait pas y en avoir.
Vers une théorie des questions "Pourquoi?"
Carl Gustav Hempel a bien réfléchi à la question et considère que la nature explicative des choses ne peut s'établir que lorsqu'il est possible de déduire logiquement des évenements particuliers à partir de propositions générales. On est séduit par cette définition, en ce qui concerne la science, mais elle possède d'importantes limites. L'explication historique est rendue presque impossible puisque le particularisme des événements historiques permet difficilement de s'appuyer sur une règle générale à moins de considérer qu'il peut exister une explication historique, comme cas particulier de l'explication scientifique. Il est donc possible, dans ce cas, de concevoir une explication historique qui se détacherait de la simple juxtaposition des faits. L'évènement ne se raconte pas, il se produit comme déduction logique d'une proposition. L'appel à la logique dans un tel cadre ouvert ne se fait cependant pas sans paradoxe. C'est ce qu'Hempel a aussi pointé dans le paradoxe du corbeau. Pour ne prendre que le versant de l'explication historique, on aperçoit, à travers Hemepl, la nécessité de concevoir le fait historique comme un fait physique (ce qui constitue une hypothèse très contraignante et souvent peu pertinente) permettant ainsi de dissocier l'explication historique du récit historique même si l'utilisation de la logique en système ouvert peut elle aussi apporter des paradoxes. La notion de probabilité peut permettre une sortie du problème en considérant que le fait historique est celui de probabilité la plus forte sur l'ensemble des faits possibles. L'explication devient probabiliste permettant de mettre à jour, pour chaque fait historique, une chaine causale dont il est la conclusion. La réalité historique ne se laisse guère emprisonner dans cette démarche. De plus associer une explication à la probabilité maximale ne fonctionnera pas avec la démonstration mathématique de probabilité 1 mais pas toujours explicative. Si l'on se tourne en outre vers l'explication scientifique, Van Fraassen pensait, quant à lui, que le caractère explicatif d'une théorie scientifique n'est jamais que secondaire, et il faut garder en tête que le critère d'acceptabilité d'une théorie scientifique est son adéquation au modèle de données issu de l'expérience... Donc dès qu'il y a science, il y a modèle et le modèle n'est pas explicatif. La demande d'explication ne serait donc pas à chercher du coté de la science mais de la psychologie, elle est différente en fonction de X et de Y. La meilleure théorie scientifique n'est pas nécessairement celle du maximum explicatif, ce caractère lui permettant tout au plus d'être distinguée parmi des théories "empiriquement équivalentes".
Comme nous le voyons, le problème n'est pas simple. Van Fraassen y a, en outre, apporté une importante contribution et pour aborder la théorie de l'explication, il écrivait:
Une explication n'est pas identique à une proposition, ou à un argument, ou à une liste de propositions; c'est une réponse (De façon analogue, un fils n'est pas identique à un homme, même si tous les fils sont des hommes, et chaque homme est un fils.). Une explication est une réponse à une question "Pourquoi?". Ainsi, une théorie de l'explication doit être une théorie des questions "Pourquoi?".
Pour lui une question "Pourquoi?", comporte trois éléments: le thème (topic), la partition des réponses (contrast class), et la relation de pertinence (relevance relation).
Lorsque quelqu'un demande "Pourquoi P?", le thème est P. Le thème est en fait ce que nous voudrions comprendre en réponse à la question une fois l'explication donnée. Ainsi parmi l'ensemble des propositions possibles énumérées dans une partition, l'une d'entre elles est la plus pertinente et constituera l'explication demandée. La relation de pertinence permet de préciser les facteurs et les contraintes associées à ce maximum de pertinence. Par exemple, dans la majorité des cas il est inapproprié de répondre à la question "Pourquoi est-ce que le sang circule dans le corps?" en termes d'action du coeur comme pompe mais plutôt en terme de nourissement des tissus. Sur le thème de la circulation du sang, parmi toutes les explications possibles sur le fait que le sens circule, la relation de pertinence permettra de sélectionner cette réponse parmi les autres et d'exprimer explicitement les contraintes retenues. La première réponse serait à retenir si l'on se restreignait au cas "mécanique". Dans les termes où sont posés la question, la seconde réponse qui est sans doute une plus pauvre explication constitue aussi celle qui est la plus attendue.
Van Fraassen fait donc apparaître trois éléments pour les réponses attendues:
La réponse attendue doit prendre en compte le niveau de nos connaissances, de notre capacité de compréhension.
La réponse attendue doit être celle ayant la plus forte probabilité de traiter le sujet parmi l'ensemble des propositions de la partition, relativement à notre savoir.
La réponse attendue doit être meilleure que d'autres réponses potentielles.
Pour se faire une idée du thème, il suffit de revenir à la question concernant Adam et la pomme et de savoir quel est l'angle d'attaque de la réponse souhaitée. Doit-elle être au sujet de la pomme, d'Adam ou sur le fait de manger? La partition est l'énumération des possibles, une fois le thème déterminé, par exemple s'il s'agit d'Adam, la question est de savoir pourquoi c'est Adam et non Eve, un autre homme, une autre femme ou un animal qui a croqué la pomme. Une fois ceci fait, il s'agit de donner la meilleure réponse sous la contrainte du savoir de celui qui l'entend.
Pour van Fraassen, l'explication est dépendante du contexte et on comprend mieux ainsi l'existence de la composante "psychologique" de la "meilleure" réponse.
Un exemple d'explication mathématique
Un théorème s'énonce en ces termes:
Dans l'un de ses livres, Patterns of Plausible Inference, George Polya proposa l'exemple d'une démonstration de ce théorème qu'il trouvait particulièrement insatisfaisante. En effet celle-ci débutait par l'utilisation d'une suite auxilliaire (c) définie par:
La suite est essentielle à la démonstration et c'est bien cela qui pose problème... Pourquoi celle-ci plus qu'une autre? Pourquoi cette place centrale du particulier là où l'on attend du général. Polya appela cela, l'étape deus ex machina, celle qui semble provenir de nulle part. Il considère cette démonstration insuffisante. Il propose que chaque auteur de la démonstration informe le lecteur de la raison pour laquelle l'étape a été réalisée ainsi. Polya propose ainsi une explication de "l'apparition" de cette suite. Il devient ainsi plus facile de suivre la démonstration. Cette explication relève d'une question "Pourquoi?". Elle peut se présenter de deux façons:
Pourquoi une suite doit-elle être introduite dans la démonstration?
Pourquoi, parmi toutes les suites, celle-là en particulier doit être choisie?
Dans son développement, Polya répond explicitement à ces deux questions. On le trouvera dans Mathematical Explanation and the Theory of Why-questions de David Sandborg.
On peut commencer à voir que ce genre de questions va mal se prêter aux définitions de Van Fraassen car d'une part, les sujets mathématiques ne peuvent se réduire à un type commun de questions "Pourquoi?" dans lequel une partition serait clairement déterminée et d'autre part les explications mathématiques ne peuvent pas se réduire aux démonstrations, car les démonstrations ne sont pas des réponses à des questions, même si parfois elles sont commodement utilisées pour le faire.
La détermination de la partition peut se percevoir comme la disjonction des réponses possibles. Par exemple dans la question "Pourquoi est-ce que cette combustion produit une flamme verte?", le vert est opposé à toute autre couleur, ce qui produit nécessairement une partition sur l'ensemble des autres couleurs possibles : Pourquoi cette couleur plutôt qu'une autre? Il n'y a pas d'autres candidats pour la réponse. Dans le cas de la justification de Polya, la suite utilisée n'est pas la seule possible et la question "Pourquoi utiliser cette suite dans la démonstration?", n'est pas une question "Pourquoi?" commune, car il n'y a pas unicité du choix de la suite. Les questions "Pourquoi?" à partition forment donc un sous-ensemble des questions "Pourquoi?". Le travail de Van Fraassen est très intéressant mais il ne permet pas de construire une théorie globale. La question de la la convergence de la série de Leibniz vers pi/ 4 est en outre une question "Pourquoi?" à partition puisqu'une démonstration existe et le nombre pi/4 est atteint avec une probabilité de 1. Mais là encore la théorie de Van Fraassen est incomplète puisqu'elle ne permet pas de valider une démonstration correcte plus qu'une autre (à condition qu'elle soit comprise par l'interlocuteur).
L'effet produit par le partitionnement des réponses possibles peut aussi produire une trivialisation de la réponse donnée. Par exemple, pour la question concernant le jour de la mort de Kennedy, on peut voir qu'une "bonne" partition peut être constituée des différents jours de décès possibles. Le thème principal de la question pourrait donc être astrologique (sans jeu de mot) et la théorie de Van Fraassen rendrait l'explication selon laquelle le jour du décès de Kennedy était le plus favorable avec l'étude scientifique des positions astrales, la plus attendue. La meilleure réponse serait incontestablement que l'influence des astres n'a rien à voir avec l'assassinat de Kennedy du 22 novembre 1963. Nous voyons qu'il est impossible sans autres ajouts, de rejeter une démonstration non explicative comme étant de "mauvaises mathématiques", tout comme il est impossible de rejeter une explication astrologique à un décès comme étant de la "mauvaise science". La trivialisation peut donc être au rendez-vous et c'est un problème auquel il faut s'attaquer si l'on veut progresser. Il est nécessaire de définir une "véritable" relation de pertinence faisant intervenir des asymétries de réponses. Les mathématiques, entre autres, rendent ce travail nécessaire. Il faut parvenir au fait que l'explication cherchée dans la question concernant la série convergente justifie et explique précisément, pourquoi est-ce que c'est la suite (c) qui est utilisée et pas une autre? La réponse attendue étant: "Le taux de croissance de la suite (c) est le plus approprié pour l'utilisation d'une suite auxilliaire aboutissant à une démonstration correcte".
Pour répondre à Van Frassen qui disait: "Une explication est une réponse à une question "Pourquoi?". Ainsi, une théorie de l'explication doit être une théorie des questions "Pourquoi?".", il semble bien que la théorie des questions "Pourquoi?" peut aider à aborder la théorie de l'explication mais cette dernière doit aller au-delà.
Les questions "Pourquoi?" en physique
L'explication de phénomènes physiques peut elle aussi poser des difficultés de théorisation. A la question "Pourquoi aucun observateur peut aller plus vite que la lumière?", on peut répondre de façon standard par le fait que:
1) C'est un axiome
ou
2) L'espace de dimension 4 de Minkovski est un bon modèle de la relativité.
Aucune de ces deux réponses n'est satisfaisante car aucune des deux n'est en fait explicative. La première ne répond n'élucide en rien la question, car elle transforme une propriété en un axiome et la seconde est liée à un modèle particulier et non à des axiomes indépendants de ce modèle. L'idée serait pour formuler la réponse à une question "Pourquoi?" physique en utilisant un langage du premier ordre contenant deux types, l'un associé aux quantités et l'autre aux corps, comprenant des axiomes indépendants entre eux et d'une modélisation future.
On peut se tourner vers la phrase de Michael Friedman : "La science accroit notre compréhension du monde en réduisant le nombre total de phénomènes indépendants que nous avons à accepter comme ultimes ou donnés."
Dans une publication sur Arxiv Gergely Székely traite de ce sujet (qui me dépasse) dans On Why-Questions in Physics. Il est cependant intéressant de constater l'émergence d'un langage et d'une réflexion permettant de formaliser des réponses à des questions "Pourquoi?" et de les comparer. Rien que pour cela je trouve qu'il était important d'en parler.
Une "bonne " réponse en physique est caractérisée par le fait qu'elle s'appuie sur peu et implique beaucoup. Il est impossible d'expliquer pourquoi les axiomes sont vrais et ils ne peuvent pas faire l'objet de questions "Pourquoi?". Ainsi si nous le demandons, il est impossible d'avancer que la théorie de Newton est une réponse acceptable aux lois de Kepler, car il est impossible d'expliquer pourquoi elle serait "vraie". En effet, la théorie de Newton est une modélisation que l'on choisit de poser en axiome. Si on impose de justifier sa vérité absolue au préalable, on ne peut le faire et on s'ampute de la réponse à la question "Pourquoi les lois de Kepler sont valides?". Poser la théorie de Newton en axiome permet de dire, en réponse à la question posée, que si la théorie de Newton est vraie alors les lois de Kepler sont valides. Même si Newton a découvert la loi de la gravitation universelle à partir des lois ded Kepler, c'est bien la première qui explique les secondes.
Conclusion
Ce billet se termine et m'a donné pas mal de fil à retordre car le sujet n'est pas vraiment simple. J'espère qu'il aura au moins eu le mérite de montrer que de telles questions se posent, qu'on est jamais loin de la mathématisation et que les mathématiques, comme un fait exprès, font toujours figure d'exception. Les réponses aux questions "Pourquoi?", lorsqu'elles cherchent à être formalisées, comme on le voit dans le cas de la physique, tomberont nécessairement sur une limitation forte liée au codage, ce qui serait certainement proche de ce que Gödel a démontré pour tout système formel contenant l'arithmétique, ce qui sera le minimum que l'on puisse demander à un système qui se veut "explicatif". Ces limitations n'empêcheront certainement pas de réaliser de fortes avancées dans la théorie de l'explication, de la définition de ses liens avec les réponses aux questions "Pourquoi?", et de la tentative de formalisation. Et une fois de plus, je dirai "Affaire à suivre!".