Je ne sais pas quand jai entendu parler du théorème de Bayes pour la première fois. Mais je nai vraiment commencé à y prêter attention quau cours de la dernière décennie, après que quelques-uns de mes étudiants les plus farfelus lont vanté comme un guide presque magique pour naviguer dans la vie.
Les diatribes de mes élèves mont dérouté, tout comme les explications du théorème sur Wikipédia et ailleurs, que jai trouvé soit trop stupide, soit trop compliqué. Jai judicieusement décidé que Bayes était une mode passagère, qui ne méritait pas une enquête plus approfondie. Mais maintenant, la fièvre de Bayes est devenue trop répandue pour être ignorée.
Les statistiques bayésiennes «se répercutent sur tout, de la physique à la recherche sur le cancer, de lécologie à la psychologie», rapporte le New York Times. Les physiciens ont proposé des interprétations bayésiennes de la mécanique quantique et les défenses bayésiennes des théories des cordes et des multivers. Les philosophes affirment que la science dans son ensemble peut être considérée comme un processus bayésien, et que Bayes peut distinguer la science de la pseudoscience plus précisément que la falsification, la méthode popularisée par Karl Popper.
Les chercheurs en intelligence artificielle, y compris les concepteurs des voitures autonomes de Google, utilisent des logiciels bayésiens pour aider les machines à reconnaître des modèles et à prendre des décisions. Les programmes bayésiens, selon Sharon Bertsch McGrayne, auteur dune histoire populaire du théorème de Bayes, « trient le spam par e-mail, évaluez les risques médicaux et de sécurité intérieure et décodez lADN, entre autres. » Sur le site Web Edge.org, le physicien John Mather sinquiète du fait que les machines bayésiennes pourraient être si intelligentes quelles rendent les humains «obsolètes».
Les scientifiques cognitifs supposent que nos cerveaux incorporent des algorithmes bayésiens lorsquils perçoivent, délibèrent, décident. En novembre, des scientifiques et des philosophes ont exploré cette possibilité lors dune conférence à lUniversité de New York intitulée « Is the Brain Bayesian? » (Je discute de la réunion sur Bloggingheads.tv et dans ce post de suivi, « Les cerveaux sont-ils bayésiens? »)
Les zélotes insistent sur le fait que si nous sommes plus nombreux à adopter le raisonnement bayésien conscient (par opposition au traitement bayésien inconscient nos cerveaux sont censés employer), le monde serait un meilleur endroit. Dans «Une explication intuitive du théorème de Bayes», le théoricien de lIA Eliezer Yudkowsky (avec qui jai déjà discuté de la singularité sur Bloggingheads.tv) reconnaît la ferveur sectaire des Bayesiens:
« Pourquoi un concept mathématique génère-t-il cet étrange enthousiasme chez ses étudiants? Quest-ce que la soi-disant Révolution bayésienne qui balaye maintenant les sciences, qui prétend subsumer même la méthode expérimentale elle-même comme un cas particulier? secret que les adhérents de Bayes connaissent? Quelle est la lumière quils ont vue? Bientôt vous le saurez. Bientôt vous serez lun de nous. Yudkowsky plaisante. Ou est-ce le cas?
Compte tenu de tout ce battage, jai essayé une fois pour toutes daller au fond de Bayes. Parmi les innombrables explications sur le Web, jai trouvé celles que jai trouvées Lessai de Yudkowsky, larticle de Wikipédia et des articles plus courts du philosophe Curtis Brown et des informaticiens Oscar Bonilla et Kalid Azad sont particulièrement utiles. Dans cet article, je vais essayer dexpliquer – principalement pour mon propre bénéfice – ce quest Bayes. les lecteurs, comme dhabitude, signaleront toute erreur. *
Nommé daprès son inventeur, le ministre presbytérien du XVIIIe siècle Thomas Bayes, le théorème de Bayes est une méthode de calcul de la validité des croyances (hypothèses, affirmations, propositions) sur la base des meilleures preuves disponibles (observations, données, informations). Voici la description la plus aberrante: croyance initiale plus nouvelle preuve = croyance nouvelle et améliorée.
Voici une version plus complète: la probabilité que une croyance est vraie étant donné que de nouvelles preuves sont égales à la probabilité que la croyance soit vraie s de cette preuve multipliée par la probabilité que la preuve soit vraie étant donné que la croyance est vraie divisée par la probabilité que la preuve soit vraie, que la croyance soit vraie ou non. Compris?
Les tests médicaux servent souvent à démontrer la formule. Supposons que vous subissiez un test de dépistage d’un cancer estimé chez 1% des personnes de votre âge. Si le test est fiable à 100%, vous navez pas besoin du théorème de Bayes pour savoir ce que signifie un test positif, mais utilisons quand même le théorème, juste pour voir comment cela fonctionne.
Pour résoudre P ( B | E), vous branchez les données dans le côté droit de léquation de Bayes. P (B), la probabilité que vous ayez un cancer avant de vous faire tester, est de 1%, ou 0,01. Il en va de même pour P (E), la probabilité que vous obteniez un résultat positif. Parce quils sont dans le numérateur et le dénominateur, respectivement, ils sannulent, et vous vous retrouvez avec P (B | E) = P (E | B) = 1. Si vous testez positif, vous avez certainement un cancer, et vice versa.
Dans le monde réel, les tests sont rarement, voire jamais totalement fiables. Disons que votre test est fiable à 99%.Autrement dit, 99 personnes sur 100 atteintes dun cancer seront testées positives, et 99 personnes sur 100 en bonne santé seront testées négatives. C’est toujours un test formidable. Si votre test est positif, quelle est la probabilité que vous ayez un cancer?
Maintenant, le théorème de Bayes montre sa puissance. La plupart des gens supposent que la réponse est de 99 pour cent, ou presque. C’est à quel point le test est fiable, non? Mais la bonne réponse, donnée par le théorème de Bayes, n’est que de 50%.
Et le dénominateur, P (E)? Cest là que les choses se compliquent. P (E) est la probabilité dêtre testé positif, que vous ayez ou non un cancer. En dautres termes, il inclut les faux positifs ainsi que les vrais positifs.
Pour calculer la probabilité dun faux positif, vous multipliez le taux de faux positifs, qui est de 1%, ou 0,01 fois le pourcentage des personnes qui nont pas de cancer, .99. Le total sélève à 0,0099. Oui, votre excellent test, précis à 99%, donne autant de faux positifs que de vrais positifs.
Finissons le calcul. Pour obtenir P (E), ajoutez les vrais et faux positifs pour un total de 0,0198, qui, une fois divisé en, 0099, revient à 0,5. Donc, encore une fois, P (B | E), la probabilité que vous ayez un cancer si votre test est positif, est de 50 pour cent.
Si vous vous faites tester à nouveau, vous pouvez réduire considérablement votre incertitude, car votre probabilité de avoir un cancer, P (B), est maintenant de 50 pour cent plutôt que dun pour cent. Si votre deuxième test est également positif, le théorème de Bayes vous indique que votre probabilité d’avoir un cancer est maintenant de 99%, soit 0,99. Comme le montre cet exemple, litération du théorème de Bayes peut fournir des informations extrêmement précises.
Mais si la fiabilité de votre test est de 90%, ce qui est encore assez bon, vos chances davoir un cancer même si vous testez positif deux fois sont toujours moins de 50 pour cent. (Vérifiez mes calculs avec la calculatrice pratique dans ce billet de blog.)
La plupart des gens, y compris les médecins, ont du mal à comprendre ces probabilités, ce qui explique pourquoi nous sommes surdiagnostiqués et traités de manière excessive pour le cancer et dautres troubles. Cet exemple suggère que les Bayésiens ont raison: le monde serait en effet un meilleur endroit si plus de gens – ou au moins plus de consommateurs et de prestataires de soins de santé – adoptaient le raisonnement bayésien.
Dun autre côté, Bayes Le théorème nest quune codification du bon sens. Comme lécrit Yudkowsky vers la fin de son tutoriel: «À ce stade, le théorème de Bayes» peut sembler manifestement évident ou même tautologique, plutôt quexcitant et nouveau. Si tel est le cas, cette introduction a entièrement atteint son objectif. »
Prenons le cas du test du cancer: le théorème de Bayes dit que votre probabilité davoir un cancer si vous testez positif est la probabilité dun test vraiment positif divisée par la probabilité de tous les tests positifs, faux et vrais. En bref, méfiez-vous des faux positifs.
Voici ma déclaration plus générale de ce principe: La plausibilité de votre croyance dépend du degré auquel votre croyance – et seulement votre croyance – explique les preuves de il. Plus il y a dexplications alternatives pour les preuves, moins votre croyance est plausible. Cest, pour moi, lessence du théorème de Bayes.
Les «explications alternatives» peuvent englober beaucoup de choses. Votre preuve peut être erronée, faussée par un instrument défectueux, une analyse défectueuse, un biais de confirmation, voire une fraude. Vos preuves peuvent être solides mais explicables par de nombreuses croyances, ou hypothèses, autres que les vôtres.
En dautres termes, il ny a rien de magique dans le théorème de Bayes. Cela revient au truisme que votre croyance nest valable que comme preuve. Si vous avez de bonnes preuves, le théorème de Bayes peut donner de bons résultats. Si vos preuves sont fragiles, le théorème de Bayes ne sera pas dune grande utilité. Déchets dans les déchets.
Le potentiel pour labus de Bayes commence par P (B), votre estimation initiale de la probabilité de votre croyance, souvent appelée «avant». Dans lexemple de test de cancer ci-dessus, on nous a donné une belle et précise a priori de un pour cent, ou 0,01, pour la prévalence du cancer. Dans le monde réel, les experts ne sentendent pas sur la façon de diagnostiquer et de compter les cancers. Votre a priori consistera souvent en une plage de probabilités plutôt quen un seul nombre.
Dans de nombreux cas, lestimation du a priori nest quune hypothèse, permettant à des facteurs subjectifs de sinfiltrer dans vos calculs. Vous pourriez deviner la probabilité de quelque chose qui – contrairement au cancer – nexiste même pas, comme les cordes, les multivers, linflation ou Dieu. Vous pourriez alors citer des preuves douteuses pour étayer votre croyance douteuse. De cette façon, le théorème de Bayes peut promouvoir la pseudoscience et la superstition ainsi que la raison.
Le théorème de Bayes est un message moral: si vous nêtes pas scrupuleux dans la recherche dexplications alternatives pour votre preuve, la preuve confirmera simplement ce que vous croyez déjà. Les scientifiques ne tiennent souvent pas compte de ce dicton, ce qui explique pourquoi tant daffirmations scientifiques se révèlent erronées. Les bayésiens affirment que leurs méthodes peuvent aider les scientifiques à surmonter les biais de confirmation et à produire des résultats plus fiables, mais jai des doutes.
Et comme je lai mentionné ci-dessus, certains passionnés de chaînes et de multivers adoptent lanalyse bayésienne. Pourquoi? Parce que les passionnés sont fatigués d’entendre que les théories des cordes et des multivers sont infalsifiables et donc non scientifiques, et le théorème de Bayes leur permet de présenter les théories sous un jour plus favorable. Dans ce cas, le théorème de Bayes, loin de contrecarrer le biais de confirmation, le permet.
Comme lécrivain scientifique Faye Flam la dit récemment dans le New York Times, les statistiques bayésiennes «ne peuvent pas nous sauver dune mauvaise science. » Le théorème de Bayes est un outil polyvalent qui peut servir nimporte quelle cause. Léminent statisticien bayésien Donald Rubin de Harvard a été consultant pour des compagnies de tabac confrontées à des poursuites pour dommages-intérêts liés au tabagisme.
Je suis néanmoins fasciné par le théorème de Bayes. Cela me rappelle la théorie de lévolution, une autre idée qui semble tautologiquement simple ou terriblement profonde, selon la façon dont vous la voyez, et qui a inspiré dabondantes absurdités ainsi que des idées profondes.
Cest peut-être parce que mon cerveau est bayésien, mais jai commencé à détecter des allusions à Bayes partout. En parcourant les œuvres complètes dEdgar Allen Poe sur mon Kindle récemment, je suis tombé sur cette phrase dans The Narrative of Arthur Gordon Pym of Nantucket: « In no des affaires de simples préjugés, pour ou contre, déduisons-nous des inférences avec une certitude totale, même à partir des données les plus simples. »
Gardez à lesprit la mise en garde de Poe avant de sauter dans le wagon Bayes.
* Mes amis Greg, Gary et Chris ont scanné ce post avant que je p la supprimé, donc ils devraient être blâmés pour toute erreur.
Post-scriptum: Andrew Gelman, un statisticien bayésien à Columbia, au blog duquel je mets un lien ci-dessus (dans la remarque sur Donald Rubin), ma envoyé ce commentaire sollicité : « Je travaille sur la science et la politique sociale et environnementale, pas sur la physique théorique, donc je ne peux pas vraiment commenter dune manière ou dune autre lutilisation de Bayes pour plaider en faveur des théories des cordes et des multivers! En fait, je n’aime pas le cadrage dans lequel le résultat est la probabilité qu’une hypothèse soit vraie. Cela fonctionne dans certains contextes simples où les «hypothèses» ou possibilités sont bien définies, par exemple la vérification orthographique (voir ici: http://andrewgelman.com/2014/01/22/spell-checking-example/). Mais je ne pense pas qu’il soit logique de penser à la probabilité qu’une hypothèse scientifique soit vraie ou fausse; voir cet article: http://andrewgelman.com/2014/01/22/spell-checking-example/. En bref, je pense que les méthodes bayésiennes sont un excellent moyen de faire des inférences au sein dun modèle, mais pas en général un bon moyen dévaluer la probabilité quun modèle ou une hypothèse soit vrai (en fait, je pense que « la probabilité quun modèle ou une hypothèse est vrai »est généralement une déclaration dénuée de sens, sauf comme indiqué dans certains exemples étroits quoique importants). Jai également remarqué ce paragraphe de la vôtre: «Dans de nombreux cas, estimer le préalable nest que supposition, permettant à des facteurs subjectifs de sinfiltrer dans vos calculs. Vous pourriez deviner la probabilité de quelque chose qui – contrairement au cancer – nexiste même pas, comme les cordes, les multivers, linflation ou Dieu. Vous pourriez alors citer des preuves douteuses pour étayer votre croyance douteuse. De cette façon, le théorème de Bayes peut promouvoir la pseudoscience et la superstition ainsi que la raison. »Je pense que cette citation est quelque peu trompeuse en ce que toutes les parties d’un modèle sont des hypothèses subjectives. Ou, pour le dire autrement, tout un modèle statistique doit être compris et évalué. Je moppose à lattitude selon laquelle le modèle de données est supposé correct alors que la distribution antérieure est suspecte. Voici quelque chose que jai écrit sur le sujet: http://andrewgelman.com/2015/01/27/perhaps-merely-accident-history-skeptics-subjectivists-alike-strain-gnat-prior-distribution-swallowing-camel-likelihood/. «
Lectures complémentaires:
Les cerveaux sont-ils bayésiens?
Est-ce que je me suis trompé sur la fin de la science?
Une fouille dans danciens fichiers me rappelle pourquoi je suis si critique de la science.
Une étude révèle une augmentation incroyable du battage médiatique scientifique.