Stelling van Bayes: wat is de grote deal?

Ik weet niet zeker wanneer ik voor het eerst hoorde van de stelling van Bayes. Maar ik begon er pas echt aandacht aan te besteden in de afgelopen tien jaar, nadat een paar van mijn verwaande studenten het hadden aangeprezen als een bijna magische gids om door het leven te navigeren.

De tirades van mijn studenten brachten me in verwarring, net als de uitleg van de stelling op Wikipedia en elders, die ik ofwel te dom of te gecompliceerd vond. Ik besloot gemakshalve dat Bayes een voorbijgaande bevlieging was, geen dieper onderzoek waard. Maar nu is Bayes-koorts te doordringend om te negeren.

Bayesiaanse statistieken “kabbelen door alles, van natuurkunde tot kankeronderzoek, ecologie tot psychologie”, meldt The New York Times. Natuurkundigen hebben Bayesiaanse interpretaties van de kwantummechanica voorgesteld. en Bayesiaanse verdediging van snaar- en multiversumtheorieën. Filosofen beweren dat wetenschap als geheel kan worden gezien als een Bayesiaans proces, en dat Bayes wetenschap nauwkeuriger van pseudowetenschap kan onderscheiden dan vervalsing, de methode die door Karl Popper werd gepopulariseerd.

Onderzoekers op het gebied van kunstmatige intelligentie, waaronder de ontwerpers van Googles zelfrijdende autos, gebruiken Bayesiaanse software om machines te helpen patronen te herkennen en beslissingen te nemen. Bayesiaanse programmas, volgens Sharon Bertsch McGrayne, auteur van een populaire geschiedenis van de stelling van Bayes, “sorteren spam van e-mail, onder meer medische en binnenlandse veiligheidsrisicos beoordelen en DNA decoderen. ” Op de website Edge.org maakt natuurkundige John Mather zich zorgen dat Bayesiaanse machines zo intelligent kunnen zijn dat ze mensen ‘overbodig’ maken.

Cognitieve wetenschappers vermoeden dat onze hersenen Bayesiaanse algoritmen gebruiken als ze waarnemen, opzettelijk beslissen. In november hebben wetenschappers en filosofen deze mogelijkheid onderzocht op een conferentie aan de New York University genaamd “Is the Brain Bayesian?” (Ik bespreek de bijeenkomst op Bloggingheads.tv en in deze vervolgpost, “Are Brains Bayesian?”)

Zeloten staan erop dat als meer van ons een bewuste Bayesiaanse redenering aannemen (in tegenstelling tot de onbewuste Bayesiaanse verwerking onze hersenen zogenaamd gebruiken), zou de wereld een betere plek zijn. In “An Intuitive Explanation of Bayes Theorem” erkent AI-theoreticus Eliezer Yudkowsky (met wie ik ooit de Singularity op Bloggingheads.tv besprak) de cultusachtige ijver van Bayesian:

“Waarom wekt een wiskundig concept dit vreemde enthousiasme bij zijn studenten op? Wat is de zogenaamde Bayesiaanse Revolutie die nu door de wetenschappen raast, die beweert zelfs de experimentele methode zelf als een speciaal geval op te nemen? geheim dat de aanhangers van Bayes weten? Wat is het licht dat ze hebben gezien? Binnenkort zul je het weten. Binnenkort zul je een van ons zijn. ” Yudkowsky maakt een grapje. Of toch?

Gezien al deze heisa, heb ik geprobeerd Bayes voor eens en voor altijd uit te zoeken. Van de talloze verklaringen op internet heb ik er een gevonden bijzonder nuttig zijn onder meer Yudkowskys essay, Wikipedias inzending en kortere stukken van filosoof Curtis Brown en computerwetenschappers Oscar Bonilla en Kalid Azad. In deze post zal ik proberen uit te leggen – voornamelijk voor mijn eigen voordeel – waar het bij Bayes allemaal om draait. lezers zullen, zoals gewoonlijk, wijzen op eventuele fouten. *

Vernoemd naar de uitvinder, de 18e-eeuwse presbyteriaanse predikant Thomas Bayes, is de stelling van Bayes een methode om de geldigheid van overtuigingen (hypothesen, claims, proposities) op basis van het beste beschikbare bewijs (observaties, gegevens, informatie). Hier is de meest afgezwakte beschrijving: aanvankelijke overtuiging plus nieuw bewijs = nieuwe en verbeterde overtuiging.

Hier is een vollediger versie: de kans dat een overtuiging is waar gegeven nieuw bewijs gelijk is aan de waarschijnlijkheid dat de overtuiging waar is s van dat bewijs maal de kans dat het bewijs waar is gegeven dat de overtuiging waar is, gedeeld door de waarschijnlijkheid dat het bewijs waar is, ongeacht of de overtuiging waar is. Begrepen?

Medische tests dienen vaak om de formule aan te tonen. Stel dat u wordt getest op kanker die naar schatting voorkomt bij één procent van de mensen van uw leeftijd. Als de test 100 procent betrouwbaar is, heb je de stelling van Bayes niet nodig om te weten wat een positieve test betekent, maar laten we de stelling toch gebruiken, gewoon om te zien hoe het werkt.

Om P ( B | E), steek je de gegevens in de rechterkant van de Bayes-vergelijking. P (B), de kans dat u kanker heeft voordat u wordt getest, is één procent of 0,01. Dus is P (E), de kans dat u positief zult testen. Omdat ze respectievelijk in de teller en de noemer staan, heffen ze elkaar op en blijft er P (B | E) = P (E | B) = 1 over. Als je positief test, heb je zeker kanker en vice versa. versa.

In de echte wereld zijn tests zelden of nooit volledig betrouwbaar. Stel dat uw test voor 99 procent betrouwbaar is.Dat wil zeggen, 99 van de 100 mensen met kanker zullen positief testen en 99 van de 100 gezonde mensen zullen negatief testen. Dat is nog steeds een geweldige test. Als uw test positief is, hoe waarschijnlijk is het dan dat u kanker heeft?

Nu toont de stelling van Bayes zijn kracht. De meeste mensen gaan ervan uit dat het antwoord 99 procent is, of dichtbij. Dat is hoe betrouwbaar de test is, toch? Maar het juiste antwoord, verkregen door de stelling van Bayes, is slechts 50 procent.

Hoe zit het met de noemer, P (E)? Hier wordt het lastig. P (E) is de kans om positief te testen, ongeacht of u kanker heeft. Met andere woorden, het omvat zowel fout-positieven als echt-positieven.

Om de kans op een fout-positief te berekenen, vermenigvuldigt u het aantal fout-positieven, dat één procent of 0,01 keer het percentage is van mensen die geen kanker hebben, .99. Het totaal komt op .0099. Ja, uw geweldige, 99 procent nauwkeurige test levert evenveel fout-positieven op als echt-positieven.

Laten we de berekening afronden. Om P (E) te krijgen, voegt u true en false positives toe voor een totaal van 0,0198, die bij verdeling in .0099 uitkomt op 0,5. Dus nogmaals, P (B | E), de kans dat je kanker hebt als je positief test, is 50 procent.

Als je je opnieuw laat testen, kun je je onzekerheid enorm verkleinen, omdat je kans op kanker hebben, P (B), is nu 50 procent in plaats van één procent. Als je tweede test ook positief uitpakt, zegt de stelling van Bayes je dat je kans om kanker te krijgen nu 99 procent of 0,99 is. Zoals dit voorbeeld laat zien, kan het herhalen van de stelling van Bayes uiterst nauwkeurige informatie opleveren.

Maar als de betrouwbaarheid van uw test 90 procent is, wat nog steeds redelijk goed is, is uw kans om daadwerkelijk kanker te krijgen, zelfs als u positief test. twee keer zijn nog steeds minder dan 50 procent. (Controleer mijn wiskunde met de handige rekenmachine in deze blogpost.)

De meeste mensen, inclusief artsen, hebben het moeilijk om deze kansen te begrijpen, wat helpt verklaren waarom we overgediagnosticeerd en overbehandeld zijn voor kanker en andere aandoeningen. Dit voorbeeld suggereert dat de Bayesianen gelijk hebben: de wereld zou inderdaad een betere plek zijn als meer mensen – of in ieder geval meer consumenten en zorgverleners in de gezondheidszorg – de Bayesiaanse redenering zouden overnemen.

Aan de andere kant, Bayes stelling is slechts een codificatie van gezond verstand. Zoals Yudkowsky aan het einde van zijn tutorial schrijft: Op dit punt, Bayes-stelling lijkt misschien overduidelijk of zelfs tautologisch, in plaats van opwindend en nieuw. Als dat het geval is, is deze introductie volledig geslaagd in zijn doel. ”

Beschouw het geval van kankertesten: de stelling van Bayes zegt dat uw kans op kanker als u positief test, de kans is op een echt positieve test gedeeld door de waarschijnlijkheid van alle positieve tests, vals en waar. Kortom, pas op voor valse positieven.

Hier is mijn meer algemene verklaring van dat principe: de aannemelijkheid van uw overtuiging hangt af van de mate waarin uw overtuiging – en alleen uw overtuiging – het bewijs voor het. Hoe meer alternatieve verklaringen er zijn voor het bewijs, hoe minder aannemelijk uw overtuiging is. Dat is voor mij de essentie van de stelling van Bayes.

“Alternatieve verklaringen” kunnen veel dingen omvatten: uw bewijs kan onjuist zijn, vertekend door een slecht functionerend instrument, foutieve analyse, voorkeur voor bevestiging, zelfs fraude. Uw bewijs is misschien wel degelijk, maar verklaarbaar door veel andere overtuigingen of hypothesen dan die van u.

Met andere woorden, er is niets magisch aan de stelling van Bayes. Het komt erop neer dat uw overtuiging slechts zo geldig is als bewijs. Als je goed bewijs hebt, kan de stelling van Bayes goede resultaten opleveren. Als je bewijs zwak is, zal de stelling van Bayes niet veel nut hebben. Garbage in, garbage out.

Het potentieel voor Bayes begint misbruik met P (B), uw eerste schatting van de waarschijnlijkheid van uw overtuiging, vaak de prior genoemd. In het bovenstaande kankertestvoorbeeld kregen we een mooie, precieze prior van één procent, of 0,01, voor de prevalentie van kanker. In de echte wereld zijn experts het oneens over de diagnose en het tellen van kankers. Uw prior zal vaak bestaan uit een reeks kansen in plaats van een enkel getal.

In veel gevallen is het schatten van de prior slechts giswerk, waardoor subjectieve factoren in uw berekeningen kunnen sluipen. Je raadt misschien de waarschijnlijkheid van iets dat – in tegenstelling tot kanker – niet eens bestaat, zoals snaren, multiversums, inflatie of God. U kunt dan twijfelachtig bewijs aanhalen om uw twijfelachtige overtuiging te ondersteunen. Op deze manier kan de stelling van Bayes zowel pseudowetenschap en bijgeloof als rede bevorderen.

Ingebed in de stelling van Bayes is een morele boodschap: als je niet scrupuleus bent in het zoeken naar alternatieve verklaringen voor je bewijs, dan is het bewijsmateriaal zal gewoon bevestigen wat u al gelooft. Wetenschappers slaan vaak geen acht op deze uitspraak, wat helpt verklaren waarom zoveel wetenschappelijke beweringen onjuist blijken te zijn. Bayesianen beweren dat hun methoden wetenschappers kunnen helpen om voorkeur voor bevestiging te overwinnen en betrouwbaardere resultaten te produceren, maar ik heb mijn twijfels.

En zoals ik hierboven al zei, omarmen sommige snaar- en multiversumenthousiasten de Bayesiaanse analyse. Waarom? Omdat de enthousiastelingen het zat zijn om te horen dat snaar- en multiversum-theorieën onfalsifieerbaar en dus onwetenschappelijk zijn, en de stelling van Bayes stelt hen in staat om de theorieën in een gunstiger daglicht te stellen. In dit geval maakt de stelling van Bayes het zeker mogelijk om de voorkeur voor bevestiging tegen te gaan.

Zoals wetenschapsschrijver Faye Flam het onlangs in The New York Times stelde, kunnen Bayesiaanse statistieken ons niet redden van slechte wetenschap. ” De stelling van Bayes is een universeel hulpmiddel dat elke zaak kan dienen. De prominente Bayesiaanse statisticus Donald Rubin van Harvard heeft gediend als adviseur voor tabaksfabrikanten die rechtszaken hebben aangespannen wegens schade door roken.

Toch ben ik gefascineerd door de stelling van Bayes. Het doet me denken aan de evolutietheorie, een ander idee dat tautologisch eenvoudig of ontmoedigend diep lijkt, afhankelijk van hoe je het bekijkt, en dat zowel tot veel onzin als tot diepgaande inzichten heeft geleid.

Misschien komt het doordat mijn brein Bayesiaans is, maar ik ben overal verwijzingen naar Bayes gaan ontdekken. Terwijl ik onlangs door Edgar Allen Poes Complete Works op mijn Kindle ploegde, kwam ik deze zin tegen in The Narrative of Arthur Gordon Pym van Nantucket: In no zaken van louter vooroordeel, voor- of nadelen, leiden we met volledige zekerheid gevolgtrekkingen af, zelfs uit de meest eenvoudige gegevens. ”

Houd Poes voorbehoud in gedachten voordat u op de Bayes-wagen springt.

* Mijn vrienden Greg, Gary en Chris hebben dit bericht gescand voordat ik p u heeft het vastgesteld, dus ze moeten de schuld krijgen van eventuele fouten.

Postscript: Andrew Gelman, een Bayesiaanse statisticus bij Columbia, naar wiens blog ik hierboven link (in de opmerking over Donald Rubin), stuurde me deze gevraagde opmerking : “Ik werk aan sociale en milieuwetenschappen en -beleid, niet aan theoretische fysica, dus ik kan op de een of andere manier niet echt iets zeggen over het gebruik van Bayes om te pleiten voor snaar- en multiversumtheorieën! Ik hou eigenlijk niet van de framing waarin de uitkomst de waarschijnlijkheid is dat een hypothese waar is. Dit werkt in enkele eenvoudige instellingen waar de ‘hypothesen’ of mogelijkheden goed zijn gedefinieerd, bijvoorbeeld spellingcontrole (zie hier: http://andrewgelman.com/2014/01/22/spell-checking-example/). Maar ik denk niet dat het logisch is om aan de waarschijnlijkheid te denken dat een wetenschappelijke hypothese waar of onwaar is; zie dit artikel: http://andrewgelman.com/2014/01/22/spell-checking-example/. Kortom, ik denk dat Bayesiaanse methoden een geweldige manier zijn om inferenties te maken binnen een model, maar in het algemeen niet een goede manier om de waarschijnlijkheid te beoordelen dat een model of hypothese waar is (ik denk inderdaad dat de waarschijnlijkheid dat een model of een hypothese is waar is over het algemeen een betekenisloze bewering, behalve zoals opgemerkt in bepaalde enge, zij het belangrijke voorbeelden). Ik heb ook deze paragraaf van jou opgemerkt: ‘In veel gevallen is het schatten van de prior slechts giswerk, waardoor subjectieve factoren in je berekeningen kunnen binnensluipen. Je raadt misschien de waarschijnlijkheid van iets dat – in tegenstelling tot kanker – niet eens bestaat, zoals snaren, multiversums, inflatie of God. U kunt dan twijfelachtig bewijs aanhalen om uw twijfelachtige overtuiging te ondersteunen. Op deze manier kan de stelling van Bayes zowel pseudowetenschap en bijgeloof als rede bevorderen. ’Ik denk dat dit citaat enigszins misleidend is omdat alle onderdelen van een model subjectief giswerk zijn. Of anders gezegd: het hele statistisch model moet worden begrepen en geëvalueerd. Ik maak bezwaar tegen de houding dat het datamodel correct wordt aangenomen terwijl de eerdere distributie verdacht is. Hier is iets dat ik over het onderwerp heb geschreven: http://andrewgelman.com/2015/01/27/perhaps-merely-accident-history-skeptics-subjectivists-alike-strain-gnat-prior-distribution-swallowing-camel-likelihood/. “

Verder lezen:

Zijn Brains Bayesiaans?

Had ik het mis met het einde van de wetenschap?

Als ik door oude bestanden kijk, weet ik waarom ik zo kritisch ben over de wetenschap.

Studie onthult een verbazingwekkende golf van wetenschappelijke hype.

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *