La corrélation n’implique pas la causalité
B cause A (causalité inverse ou causalité inversée)
La causalité inverse ou causalité inversée ou fausse direction est un sophisme informel de cause douteuse où la cause et l’effet sont inversés. On dit que la cause est l’effet et vice versa.
Exemple 1 Plus on observe que les moulins à vent tournent vite, plus on observe de vent. Par conséquent, le vent est causé par la rotation des moulins à vent. (Ou, plus simplement : les moulins à vent, comme leur nom l’indique, sont des machines utilisées pour produire du vent).
Dans cet exemple, la corrélation (simultanéité) entre l’activité des moulins à vent et la vitesse du vent n’implique pas que le vent soit causé par les moulins à vent. C’est plutôt l’inverse, comme le suggère le fait que le vent n’a pas besoin des moulins à vent pour exister, alors que les moulins à vent ont besoin du vent pour tourner. Le vent peut être observé dans des endroits où il n’y a pas de moulins à vent ou des moulins à vent qui ne tournent pas – et il y a de bonnes raisons de croire que le vent existait avant l’invention des moulins à vent.
Exemple 2
Dans d’autres cas, il peut simplement être difficile de savoir quelle est la cause et quel est l’effet. Par exemple :
Les enfants qui regardent beaucoup la télévision sont les plus violents. Il est clair que la télévision rend les enfants plus violents.
Cela pourrait facilement être l’inverse, c’est-à-dire que les enfants violents aiment regarder plus la télévision que les enfants moins violents.
Exemple 3
Une corrélation entre la consommation de drogues récréatives et les troubles psychiatriques pourrait être dans les deux sens : peut-être que les drogues causent les troubles, ou peut-être que les gens utilisent des drogues pour s’auto-médicamenter pour des conditions préexistantes. La théorie de la drogue-passerelle peut soutenir que la consommation de marijuana conduit à la consommation de drogues plus dures, mais la consommation de drogues dures peut conduire à la consommation de marijuana (voir également la confusion de l’inverse). En effet, dans les sciences sociales où les expériences contrôlées ne peuvent souvent pas être utilisées pour discerner la direction de la causalité, ce sophisme peut alimenter des arguments scientifiques de longue date. Un tel exemple peut être trouvé dans l’économie de l’éducation, entre le modèle de dépistage/signalisation et le modèle de capital humain : il pourrait être soit que le fait d’avoir une capacité innée permet de compléter une éducation, soit que le fait de compléter une éducation construit sa capacité.
Exemple 4
Un exemple historique de ceci est que les Européens du Moyen Âge croyaient que les poux étaient bénéfiques pour votre santé, car il y aurait rarement des poux sur les personnes malades. Le raisonnement était que les gens tombaient malades parce que les poux partaient. Mais la véritable raison est que les poux sont extrêmement sensibles à la température corporelle. Une légère augmentation de la température corporelle, comme dans le cas d’une fièvre, incite les poux à chercher un autre hôte. Le thermomètre médical n’ayant pas encore été inventé, cette augmentation de la température était rarement remarquée. Les symptômes perceptibles sont apparus plus tard, donnant l’impression que les poux étaient partis avant que la personne ne tombe malade.
Dans d’autres cas, deux phénomènes peuvent chacun être une cause partielle de l’autre ; pensez à la pauvreté et au manque d’éducation, ou à la procrastination et à la mauvaise estime de soi. Celui qui argumente sur la base de ces deux phénomènes doit cependant veiller à éviter le sophisme de la cause circulaire et de la conséquence. La pauvreté est une cause du manque d’éducation, mais elle n’en est pas la seule cause, et vice versa.
Le troisième facteur C (la variable de causalité commune) cause à la fois A et BEdit
Le sophisme de la troisième cause (également connu sous le nom d’ignorance d’une cause commune ou de cause douteuse) est un sophisme logique où une relation fallacieuse est confondue avec la causalité. Il affirme que X cause Y alors qu’en réalité, X et Y sont tous deux causés par Z. Il s’agit d’une variation du sophisme post hoc ergo propter hoc et d’un membre du groupe de sophismes des causes douteuses.
Tous ces exemples traitent d’une variable cachée, qui est simplement une troisième variable cachée qui affecte les deux causes de la corrélation. Une difficulté se présente souvent aussi lorsque le troisième facteur, bien que fondamentalement différent de A et B, est si étroitement lié à A et/ou B qu’il est confondu avec eux ou très difficile à démêler scientifiquement d’eux (voir exemple 4).
Exemple 1 Dormir avec ses chaussures est fortement corrélé avec le fait de se réveiller avec un mal de tête. Par conséquent, dormir avec ses chaussures provoque des maux de tête.
L’exemple ci-dessus commet le sophisme de la corrélation impliquant la causalité, car il conclut prématurément que dormir avec ses chaussures provoque des maux de tête. Une explication plus plausible est que les deux sont causés par un troisième facteur, dans ce cas se coucher ivre, ce qui donne ainsi lieu à une corrélation. La conclusion est donc fausse.
Exemple 2 Les jeunes enfants qui dorment avec la lumière allumée sont beaucoup plus susceptibles de développer une myopie plus tard dans leur vie. Par conséquent, dormir avec la lumière allumée provoque la myopie.
C’est un exemple scientifique qui résulte d’une étude du centre médical de l’université de Pennsylvanie. Publiée dans le numéro de Nature du 13 mai 1999, l’étude a été très médiatisée à l’époque dans la presse populaire. Cependant, une étude ultérieure menée à l’Université d’État de l’Ohio n’a pas révélé que les nourrissons dormant avec la lumière allumée provoquaient le développement de la myopie. Elle a en revanche mis en évidence un lien étroit entre la myopie des parents et le développement de la myopie de l’enfant, en notant également que les parents myopes étaient plus susceptibles de laisser la lumière allumée dans la chambre de leurs enfants. Dans ce cas, la cause des deux conditions est la myopie parentale, et la conclusion énoncée ci-dessus est fausse.
Exemple 3 Lorsque les ventes de crème glacée augmentent, le taux de décès par noyade augmente fortement. Par conséquent, la consommation de crème glacée provoque des noyades.
Cet exemple ne reconnaît pas l’importance de la période de l’année et de la température sur les ventes de crème glacée. La crème glacée est vendue pendant les mois d’été chauds à un taux beaucoup plus élevé que pendant les périodes plus froides, et c’est pendant ces mois d’été chauds que les gens sont plus susceptibles de s’engager dans des activités impliquant l’eau, comme la natation. L’augmentation des décès par noyade est simplement due à une plus grande exposition aux activités aquatiques, et non à la crème glacée. La conclusion énoncée est fausse.
Exemple 4 Une étude hypothétique montre une relation entre les scores d’anxiété aux tests et les scores de timidité, avec une valeur r statistique (force de la corrélation) de + 0,59. Par conséquent, on peut conclure simplement que la timidité, dans une certaine mesure, influence de manière causale l’anxiété aux tests.
Cependant, comme on le rencontre dans de nombreuses études psychologiques, on découvre une autre variable, un « score de conscience de soi », qui présente une corrélation plus forte (+.73) avec la timidité. Cela suggère un éventuel problème de « troisième variable ». Toutefois, lorsque trois mesures aussi étroitement liées sont trouvées, cela suggère également que chacune d’entre elles peut avoir des tendances bidirectionnelles (voir « variable bidirectionnelle », ci-dessus), étant un ensemble de valeurs corrélées qui s’influencent mutuellement dans une certaine mesure. Par conséquent, la conclusion simple ci-dessus peut être fausse.
Exemple 5 Depuis les années 1950, le niveau de CO2 atmosphérique et les niveaux d’obésité ont tous deux fortement augmenté. Par conséquent, le CO2 atmosphérique provoque l’obésité.
Les populations plus riches ont tendance à manger plus et à produire plus de CO2.
Exemple 6 Le cholestérol HDL (« bon ») est négativement corrélé à l’incidence des crises cardiaques. Par conséquent, la prise de médicaments pour augmenter le HDL diminue les chances d’avoir une crise cardiaque.
Des recherches plus poussées ont remis en question cette conclusion. Au lieu de cela, il se peut que d’autres facteurs sous-jacents, comme les gènes, le régime alimentaire et l’exercice, affectent à la fois les niveaux de HDL et la probabilité d’avoir une crise cardiaque ; il est possible que les médicaments affectent le facteur directement mesurable, les niveaux de HDL, sans affecter la probabilité de crise cardiaque.
Cause bidirectionnelle : A cause de B, et B cause AEdit
La causalité n’est pas nécessairement à sens unique ; dans une relation prédateur-proie, le nombre de prédateurs affecte le nombre de proies, mais le nombre de proies, c’est-à-dire l’approvisionnement en nourriture, affecte également le nombre de prédateurs. Un autre exemple bien connu est que les cyclistes ont un indice de masse corporelle inférieur à celui des personnes qui ne font pas de vélo. On explique souvent ce phénomène en supposant que le cyclisme augmente le niveau d’activité physique et diminue donc l’IMC. Comme les résultats d’études prospectives sur les personnes qui augmentent leur utilisation du vélo montrent un effet plus faible sur l’IMC que les études transversales, il peut également y avoir une certaine causalité inverse (c’est-à-dire que les personnes ayant un IMC plus faible sont plus susceptibles de faire du vélo).
La relation entre A et B est une coïncidenceModifier
Les deux variables ne sont pas du tout liées, mais sont corrélées par hasard. Plus on examine les choses, plus il est probable que deux variables sans rapport semblent être liées. Par exemple:
- Le résultat du dernier match à domicile des Redskins de Washington avant l’élection présidentielle a prédit le résultat de chaque élection présidentielle de 1936 à 2000 inclus, malgré le fait que les résultats des matchs de football n’avaient rien à voir avec le résultat de l’élection populaire. Cette série a finalement été brisée en 2004 (ou 2012 en utilisant une formulation alternative de la règle originale).
- La loi de Mierscheid, qui établit une corrélation entre la part du vote populaire du Parti social-démocrate d’Allemagne et la taille de la production d’acier brut en Allemagne de l’Ouest.
- Alternance des dirigeants russes chauves et chevelus : Un chef d’État chauve (ou manifestement chauve) de Russie a succédé à un non chauve (« chevelu »), et vice versa, depuis près de 200 ans.
- Le code de la Bible, mots hébreux prédisant des événements historiques supposés cachés dans la Torah : le nombre énorme de combinaisons de lettres rend les apparitions de n’importe quel mot dans un texte suffisamment long statistiquement insignifiantes.