Le printemps et mes allergies revenus, j’ai décidé de passer par la pharmacie acheter quelques anti-allergiques. Après m’être passablement énervé contre la pharmacienne qui me proposait de l’homéopathie (les allergies me rendent grincheux…), j’ai décidé de me remonter le moral en lisant quelques billets du blog Le Pharmachien (efficacité garantie!) et notamment son comic strip à propos de la dépression. Je tombe alors sur cette info qui me rappelle des souvenirs: près de 3/4 des personnes commettant un suicide souffraient de dépression. Tiens, tiens, ne serait-ce pas là un exemple de “probabilité inversée”?!
Probabilité conditionnelle
Mathématiquement, on note p(A|B) -prononcez p de A sachant B- la probabilité que l’évènement A se produise sachant que B a eu lieu. Il s’agit d’une probabilité conditionnelle. Or cela peut paraitre étrange au premier abord mais p(A|B) n’est généralement pas égale à p(B|A). Sur l’exemple cité, si on note A l’évènement “commettre un suicide” et B “souffrir de dépression”, p(A|B) donne la probabilité de commettre un suicide sachant qu’on est dépressif et p(B|A) celle d’avoir affaire à une personne dépressive sachant que cette personne s’est suicidée. Vous voyez la différence?
Dans notre exemple[ref]Je tiens Le Pharmachien pour entièrement responsable de ce début d’article plus que morbide :)[/ref], calculer p(B|A) est simple: il suffit de recenser le nombre de suicidés et de regarder si ces personnes étaient dépressives ou non avant leur suicide. “3/4 des personnes commettant un suicide souffraient de dépression” nous donne justement cette information. Or, ce qui généralement peut intéresser l’entourage d’une personne dépressive, c’est de savoir la probabilité que cette connaissance se suicide, ce qui n’est certainement pas de 75% (3/4), du moins je l’espère!
Propagande
En fait, Wikipedia avance un pourcentage de 3,4% aux USA et j’imagine que cela doit être du même ordre de grandeur en France. Concrètement, une personne déprimée a environ 3% de risque de se suicider. Remarquez que cette donnée fait beaucoup moins peur que le 3/4 avancé au départ. Vous l’aurez donc compris, la confusion entre p(A|B) et p(B|A) est ici entretenue à des fins de propagandes (consciemment ou non). On comprend aisément l’importance d’un tel message, mais on peut regretter l’utilisation abusive de ce genre de probabilité “inversée” notamment par la grande presse. On pourrait faire passer le même message tout en gardant le caractère agressif en parlant en terme de probabilité relative: une personne dépressive a 30% de risque en plus qu’une personne saine de ce suicider[ref]J’ai trouvé cette information sur cette page mais ce n’est pas sourcée donc à prendre avec précaution.[/ref]. Ce qui me semble suffisamment fort pour faire passer le message de sensibilisation.
Manipulation
“Seulement un homme sur mille qui maltraite sa femme finit par la tuer.” C’est l’argument utilisé par les avocats de O.J. Simpson pour le défendre pendant son procès[ref]Cet exemple est extrait du livre Dicing with Death de Stephen Senn, édition Cambridge University Press.[/ref]. Les violentes disputes entre sa femme et lui n’étaient pas contestées mais la défense cherchait à démontrer avec cet argument que la probabilité que Simpson ait tué sa femme était extrêmement faible. La manipulation vous saute-t-elle aux yeux? Elle n’est pas forcément évidente.
Il ne s’agit pas tout à fait d’un cas de probabilité “inversée”, mais cela y ressemble bougrement. Notons A l’évènement “le mari tue la femme” et B l’évènement “le mari bat la femme”. Les avocats nous donnent p(A|B) qui est faible et ce n’est pas une surprise. Après tout, la plupart des femmes ne sont pas tuées et cela reste vraie même pour celles qui sont victimes de violences conjugales. Or la donnée qui nous intéresse ici est tout autre puisque nous savons déjà que la compagne a été tuée. En d’autres termes, un jury devrait plutôt se demander quelle est la probabilité que le mari soit coupable sachant que la femme est morte et que son mari la violente? Ou encore, quelle est la probabilité qu’une femme battue par son mari soit tuée par quelqu’un d’autre que son mari? On conçoit alors volontiers que le risque que le mari ait tué sa femme est bien plus grand que le 1/1000 annoncé au départ[ref]Dans un article célèbre, I.J. Good estime cette probabilité à 50% et en communique les détails dans la revue Nature.[/ref]
Les probabilités, il faut s’en méfier!
Les médias sont toujours très friands de ces probabilités “inversées” car l’effet choc est généralement assuré. Souvenez-vous par exemple du tollé qu’avait crée Eric Zemmour qui affirmait quelque chose du genre: la grande majorité des délinquants sont noirs ou arabes. Un bel exemple de probabilité inversée, car si les noirs et les arabes sont surreprésentés chez les délinquants ce qui nous intéresse ici est de savoir quelle est la probabilité qu’une personne noire ou arabe soit un délinquant? Évidemment, cette probabilité est beaucoup plus faible et contredit l’idée reçue que les étrangers sont des délinquants et sur lequel Zemmour cherchait à surfer du temps de sa médiatisation.
On pourrait par ailleurs signaler un deuxième biais de raisonnement dont on a régulièrement parlé sur ce blog et qui se cumule avec ce jeu “d’inversement” sur les probabilités: corrélation et causalité. La corrélation éventuellement observée entre noirs, arabes et délinquants, n’impliqueraient pas forcément une causalité: parce qu’ils sont noirs et arabes, ils sont délinquants. Il est d’ailleurs évident que la première cause de délinquance est à chercher du côté des conditions sociales et non d’une quelconque couleur de peau ou de “culture”. Mais ceci est un autre débat!
Maintenant que vous savez tout ou presque[ref]Pour aller un peu plus loin, je vous conseille la lecture de cet article sur l’observatoire zététique qui détaille un peu plus les notions mathématiques sous-jacentes (et notamment le fameux théorème de Bayes sur lequel je reviendrai).[/ref], c’est à vous de jouer! Je vous invite à poster vos plus beaux exemples de probabilités inverses et un peu moins glauques que ceux que j’ai donnés, hein!
sham (Facebook, Twitter, Google+)
PS: La première illustration de cet article étant peut-être un peu difficile à comprendre pour certains, une petite explication rapide s’impose. La blague vient du décalage entre la probabilité faible d’être touché par la foudre, qui augmente drastiquement si on y ajoute une condition: la probabilité d’être touché par la foudre sachant que vous êtes à proximité d’un arbre au milieu d’un champ pendant un gros orage…. Comme toujours (pour ceux qui connaissent), une phrase en plus (que je vous laisse découvrir) s’affiche quand on place la souris sur l’image sur le site xkcd.
Salut Nima!
Félicitations pour cet exposé éloquent! Je plaide coupable à la “probabilité inversée” avec plaisir, en autant que tu t’excuses d’avoir suggéré que mes propos puissent être aussi choquants que ceux d’une homéopathe! 😉
La donnée vient du Ministère de la Santé du Québec et je suis d’accord avec toi qu’elle est sensationnaliste, ce que je trouve très bien car ma BD est tout à fait sensationnelle…
Je crois tout de même qu’une statistique peut avoir de la valeur sans tenter de lui attribuer une probabilité. Le problème n’est pas la statistique mais bien son interprétation. Ceci dit, je suis d’accord avec toi que cela peut porter à confusion. Pour générer moins de controverse, j’aurais pu dire plutôt:
“La dépression est l’un des principaux facteurs de risque de suicide”
Une affirmation banale et moins informative, mais mathématiquement correcte…!
À bientôt!
Olivier
Hello Olivier, ce n’était évidemment qu’une petite taquinerie et surtout un prétexte pour parler de ce sujet que je voulais traiter depuis quelque temps. je suis grand fan comme tu le sais de ton blog 🙂
Décidément, c’est mon jour ! je viens de me taper un petit cours d’auto défense intellectuelle (mon livre de chevet actuel, N. Baillargeon) et en particulier sur les stat. et proba. à maîtriser pour se prémunir des superstitions et des choses qu’on veut nous faire gober, pour nous manipuler…bref, merci pour ce complément d’informations…
Et je compatis pour tes allergies et les pharmaciens pro-homéo…dans la même situation, je ne sais jamais quoi leur répondre quand ils me proposent les petites granules…snober, contre-argumenter (fatiguant! ) ou refuser sans un mot…brr, en tous cas, c’est très désagréable !
Pour les pharmaciens qui prônent l’homéo, j’aurai tendance à répondre qu’en temps normal, je bois mon café noir mais qu’en période allergique, je sucre exceptionnellement mon café car je suis particulièrement soucieux de ma santé. Et ça marche! Sinon, je devrait essayé de leur demander de m’expliquer comment fonctionne la mémoire de l’eau, ça pourrait être drôle.
Très intéressant cet article !
Je participe au grand jeu : “Donne un exemple de statistique inversée”.
Environ un Français sur deux meurt à l’hôpital : http://www.ladocumentationfrancaise.fr/var/storage/rapports-publics/104000037/0000.pdf
Cela ne signifie évidemment pas qu’une hospitalisation sur deux se conclut par un décès. Heureusement !
héhé, pas mal zoélie 🙂 on reste dans le morbide mais c’est un bel exemple. tu prends la pole position 😉
(et bravo à ton blog que je découvre)
Merci pour ton article !
Dans l’exemple Zemmour, la différence corrélation et causalité est le bon point d’attaque à mon avis (et ça mérite un futur article :)). Car parler de probabilité inversée n’est pas évidente et contre productif à ce niveau. Si les gens seront d’accord pour admettre que Zemmour et les médias grossissent le trait, ils vont s’attendre à s’approcher de la valeur de N% d’immigrés (ou qui en ont la tête) en prison, où N représente le % sur la population globale. Or si on est > N (je suppose, j’en sais rien), la démonstration n’aura servi à rien.
Je ne suis pas sûr qu’il s’agisse toujours d’inversion. Dans le cas de la dépression par exemple, il est naturel de se demander si un suicide a fréquemment pour “cause” (potentielle) une dépression, et donc si un suicide a souvent lieu sur fond de dépression. Dans ce cas, c’est bien la valeur donnée qui nous intéresse. En général, les deux probabilités conditionnelles ont un intérêt. Ceci dit, je suis bien d’accord que c’est trompeur si on confond les deux, et le cas de Zemmour me semble frappant de ce point de vue.
Un exemple récent et extrême est la publicité pour le loto “100% des gagnants ont tenté leur chance” 🙂
Bonne continuation et merci pour ce billet.
Hello Nicolas! tu connais tout ça bien mieux que moi, mais je pense que ce qui est le plus gênant c’est la confusion que cela créé. 75% des suicidés sont dépressifs sera forcément perçu par la population comme: la grande majorité des dépressifs se suicident. ce qui n’est évidemment pas le cas. parler en risque relatif me semble plus intéressant et plus juste. c’est le même effet recherché par le slogan du loto. quand il s’agit d’information à caractère préventif, c’est pas très gênant, dans les autres cas cela le devient beaucoup plus.
Ah, de longs débats avec ma mère quand j’étais ado.
“mais tu sais que tous les gens qui prennent de l’héroïne ont commencé par prendre du cannabis !” …
“oui Maman, et tous les gens qui ont un accident de voiture ont le permis aussi”
Bonjour,
Super article ! Et vivement un autre sur la notion de “corrélation” 😉
Un truc que j’entendais quand j’étais jeune : “98% des héroïnomanes ont commencé par fumer du cannabis.” Bizarrement, on ne me parlait jamais de l’autre probabilité…
Une question se pose: de quoi souffrait le quart restant?
D’un désir mortel de vivre ?
Un exemple extrême, c’est “100 % des gagnants ont tenté leur chance”…
@anty déjà signalé par nicolas, anty->disqualifié pour manque de vigilance 😉
sinon david marque des points avec son permis de conduire
Ping : Probabilités inversées et propaga...
Ce que je réponds à un pharmacien qui me propose de l’homéopathie : “j’ai trop peur des effets secondaires !”. En général, ça les fait rire ou sourire, comme quoi, ils sont peut-être un peu faux-culs
“Évidemment, cette probabilité est beaucoup plus faible et contredit l’idée reçue que les étrangers sont des délinquants et sur lequel Zemmour cherchait à surfer du temps de sa médiatisation.”
Je viens de re-regarder la séquence où il dit ça et c’est pour justifier les nombreuses contrôles que subissent les noirs et les arabes. Donc je vois pas trop ce que les probabilités inversées viennent faire là-dedans.
ces sceptiques qui vérifient tout sont vraiment pénibles 😉
ok, je n’ai pas pris la peine de vérifier le contexte et l’histoire. c’est tout de même des raccourcis qu’on entend régulièrement et dans la bouche de Zemmour, vu son passé…enfin on peut m’accuser de faire des procès d’intention, c’est sûr.
@paul excellent! je m’en souviendrai la prochaine fois!
Un peu dommage de terminer un si beau billet par un argument d’autorité :
“Il est d’ailleurs évident que la première cause de délinquance est à chercher du côté des conditions sociales et non d’une quelconque couleur de peau ou de « culture ».”
Immédiatement suivi d’un verrou linguistique qui empêche la discussion :
“Mais ceci est un autre débat!”
Il me semble que de tels sujets doivent être complexes et mêler une diversité de paramètres, et mériteraient des débats un peu plus techniques. De nombreuses études ont d’ailleurs montré (argument d’autorité fallacieux en absence des sources) qu’il n’était pas possible de faire le lien entre pauvreté et criminalité.
A part ça, bravo pour votre blog.
Bonjour François,
je vous trouve un peu dur à propos de l’argument d’autorité. il me semblait dire une banalité, il ne s’agissait pas vraiment d’un argument. “conditions sociales” est un terme extrêmement large (volontairement) et vous l’interprétez par “pauvreté implique criminalité”, ce n’est pas ce que je dis. je ne voulais justement pas rentrer dans une discussion politique car on sort du cadre de ce que je veux faire dans ce blog (bien que je sois personnellement très politisé). merci tout de même pour les encouragements!
Mon commentaire se voulait plus un clin d’œil qu’une véritable critique. Une façon de montrer qu’il est difficile de tenir l’exigence au quotidien et sur tous les sujets. C’est d’ailleurs un (des nombreux) points intéressants du livre « La démocratie des crédules ». Je l’ai écrit à la va-vite de ma pause du midi, désolé si le ton vous a paru trop sérieux. La fin se voulait une autodérision, parce que je me suis pris en flagrant délit d’avis sur la question alors qu’au fond, je suis bien trop peu documenté sur le sujet pour me le permettre.
Si vous ou vous certains de vos contributeurs ont de la lecture à conseiller, je suis preneur.
A bientôt sur votre blog.
Ping : Probabilités inversées et propaga...
Je crois que j’en tiens un:
http://www.sylviesimonrevelations.com/article-semaine-europeenne-de-la-vaccination-la-gravite-de-la-rubeole-72783732.html
” [La rubéole] menace les femmes pendant les trois premiers mois de leur grossesse car le fœtus risque de naître avec de graves malformations. On oublie d’ajouter que […] bien d’autres causes peuvent être responsables de malformations congénitales dont seules 10 % d’entre elles sont dues au virus de la rubéole. ”
A=malformation congénitale
B=rubéole en début de grossesse
P(B|A)=10%
P(A|B)= 70 à 90% durant les 11 premières semaines, entre 15 à 60% entre les 11 ème et 18ème semaine
(http://fr.wikipedia.org/wiki/Rub%C3%A9ole)
C’est un chouette jeu. Maintenant je vois tout de suite le problème grâce à la lecture de ton billet.
Ping : Michèle Rivasi (EELV) sur Angelina Jolie : indécent et révoltant ! - Contrepoints | Contrepoints
Et cà, cela en est un ?
17% des accidents sont provoqués par des gens ivres. Ce qui veut dire que 83% des accidents sont provoqué par des gens sobre, il faut donc que ces enfoirés de sobres restent chez eux pour augmenter la sécurité de 400%
(Circule sur Facebook …)
Ce n’est pas exactement un problème de probabilités inversées, mais c’est sans conteste un problème de propagande, de plus odieuse :
http://www.huffingtonpost.fr/michele-rivasi/abblation-agelina-jolie-fausse-solution_b_3342277.html
Un coup de gueule ici :
http://www.imposteurs.org/article-michele-rivasi-sur-angelina-jolie-ignoble-indecent-revoltant-par-wackes-seppi-118230625.html
Mme Rivasi a cru bon de faire dans l’anticapitalisme (oups ! Altermondialisme, ça fait plus dans l’air du temps) primaire sur le dos de la santé en montant en épingle la malversation des prothèses PIP et en suggérant l’inqualifiable à propos de l’annonce de sa mastectomie bilatérale par Mme Angelina Jolie.
Ça donne sur le plan statistique : « …seul 1% des femmes présentent la mutation du gène BRCA1 ou BRCA2. C’est donc que l’épidémie de cancers a d’autres causes. »
Sachant par ailleurs que ce sont 5 % des tumeurs mammaires qui sont liées au mauvais fonctionnement du BRCA1, plus rarement du BRCA2, selon le Dr Jean-Daniel Flaysakier. Et que le risque de cancer du sein des femmes porteuses d’un gène BCRA défectueux, au cours de l’existence, varie de 60 à 87 % selon les études.
http://www.docteurjd.com/2013/05/15/cancer-du-sein-lacte-doublement-couageux-dangelina-jolie/
Je me suis permis un tout petit commentaire sur son site. Sa réponse :
« Le billet de Michele Rivasi est une honte. Écrire autant de conneries en si peu de lignes relève de l’exploit. Voici ce texte qu’il faut lire pour voir qu’on peut effectivement faire pire que Boutin [suit le lien vers le Huff]. »
Il y a les études dite cas-témoins qui peuvent prêter à confusion et voici pourquoi. Pour être plus explicite j’illustre avec une étude cas-témoins visant à étudier le lien entre la SEP (sclérose en plaques) et la vaccination hépatite B (aucune arrière pensée dans ce choix …). Il y a les cas c’est à dire ceux atteints de SEP et les témoins qui sont associés à chaque cas (par exemple 10 témoins par cas, même âge, même sexe …). Parmi les cas et les témoins il y a des vaccinés et des non vaccinés. Le but de l’étude est de comparer la probabilité d’être vacciné parmi les cas et parmi les témoins, ce qui n’est pas habituel.
Chacun pensera généralement qu’on cherche à comparer la probabilité de faire une SEP si on est vacciné avec la probabilité d’en faire une si on n’est pas vacciné. Dans ce sens c’est effectivement plus habituel. D’où une difficulté non négligeable pour comprendre comment fonctionne une étude cas-témoins, certains pensant que les témoins sont non vaccinés comme je l’ai constaté sur un blog de médecins où j’ai dû me battre pour faire admettre que ce n’était pas cela.
Fondamentalement le test pour une étude cas-témoins est le test de comparaison de 2 lois binomiales qu’on transforme en test de l’odds ratio en passant à la forme multiplicative, ce qui fait le succès des études épidémiologiques médiatisées : les personnes exposées à tel produit ont 2 fois plus de risque de faire ceci… Mais si le risque absolu est 1 sur 1 milliard ça ne changera pas grand chose. Par contre, 2 fois plus ça en impose…
http://questionvaccins.canalblog.com/archives/2011/03/18/20609338.html