Bayes sætning: Hvad er big deal?

Jeg er ikke sikker på, hvornår jeg første gang hørte om Bayes sætning. Men jeg begyndte først virkelig at være opmærksom på det i løbet af det sidste årti, efter at et par af mine dyre studerende udråbte det som en næsten magisk guide til at navigere gennem livet.

Mine elevers rants forvirrede mig, ligesom forklaringer gjorde af sætningen på Wikipedia og andre steder, som jeg enten fandt for dummet eller for kompliceret. Jeg besluttede bekvemt, at Bayes var en forbipasserende fad, ikke værd at undersøge dybere. Men nu er Bayes-feber blevet for udbredt til at ignorere.

Bayesianske statistikker “kryber gennem alt fra fysik til kræftforskning, økologi til psykologi,” rapporterer The New York Times. Fysikere har foreslået Bayesiske fortolkninger af kvantemekanik. og Bayesianske forsvar af streng- og multiverse teorier. Filosoffer hævder, at videnskaben som helhed kan ses som en Bayesisk proces, og at Bayes kan skelne videnskab fra pseudovidenskab mere præcist end forfalskning, den metode, som Karl Popper populariserede.

> Forskere med kunstig intelligens, herunder designere af Googles selvkørende biler, anvender Bayesian-software til at hjælpe maskiner med at genkende mønstre og træffe beslutninger. Bayesianske programmer ifølge Sharon Bertsch McGrayne, forfatter til en populær historie om Bayes sætning, “sorter spam fra e-mail, vurdere medicinske og hjemlige sikkerhedsrisici og afkode DNA blandt andet. ” På webstedet Edge.org bekymrer fysikeren John Mather sig om, at Bayesianske maskiner måske er så intelligente, at de gør mennesker “forældede.”

Kognitive forskere antager, at vores hjerner inkorporerer Bayesiske algoritmer, som de opfatter, bevidst, beslutter. I november undersøgte forskere og filosoffer denne mulighed på en konference ved New York University kaldet “Er Brain Bayesian?” (Jeg diskuterer mødet på Bloggingheads.tv og i dette opfølgende indlæg, “Er hjerner Bayesian?”)

Zealoter insisterer på, at hvis flere af os vedtog bevidst Bayesian-ræsonnement (i modsætning til den ubevidste Bayesian-behandling) vores hjerner angiveligt anvender), ville verden være et bedre sted. I “En intuitiv forklaring af Bayes sætning,” anerkender AI-teoretikeren Eliezer Yudkowsky (med hvem jeg engang diskuterede singulariteten på Bloggingheads.tv) Bayesianernes kulturelle glæde:

“Hvorfor frembringer et matematisk koncept denne mærkelige entusiasme hos sine studerende? Hvad er den såkaldte Bayesian Revolution, der nu fejer gennem videnskaberne, der hævder at underkaste sig selv den eksperimentelle metode som et specielt tilfælde? Hvad er hemmelighed at Bayes tilhængere ved? Hvad er det lys, de har set? Snart vil du vide det. Snart bliver du en af os. ” Yudkowsky laver sjov. Eller er han?

I betragtning af al denne hoopla har jeg forsøgt at komme til bunden af Bayes en gang for alle. Af de utallige forklaringer på nettet, dem jeg har fundet især nyttigt inkluderer Yudkowskys essay, Wikipedias indlæg og kortere stykker af filosofen Curtis Brown og computerforskerne Oscar Bonilla og Kalid Azad. I dette indlæg vil jeg forsøge at forklare – primært til min egen fordel – hvad Bayes handler om. Jeg stoler på venlig læsere vil som sædvanligt påpege eventuelle fejl. *

Opkaldt efter opfinderen, den 18. århundredes presbyterianske minister Thomas Bayes, er Bayes sætning en metode til beregning af gyldigheden af tro (hypoteser, påstande, propositioner) baseret på de bedste tilgængelige beviser (observationer, data, information). Her er den mest nedtonede beskrivelse: Indledende tro plus nyt bevis = ny og forbedret overbevisning.

Her er en fyldigere version: Sandsynligheden for en tro er sand, givet nye beviser er lig med sandsynligheden for, at troen er ægte betragtninger s af dette bevis gange sandsynligheden for, at beviset er sandt i betragtning af at troen er sand divideret med sandsynligheden for, at beviset er sandt uanset om troen er sand. Har du det?

Medicinsk test tjener ofte til at demonstrere formlen. Lad os sige, at du bliver testet for kræft, der anslås at forekomme hos en procent af mennesker i din alder. Hvis testen er 100 procent pålidelig, behøver du ikke Bayes sætning for at vide, hvad en positiv test betyder, men lad os alligevel bruge sætningen, bare for at se, hvordan den fungerer.

For at løse for P ( B | E), sætter du dataene i højre side af Bayes ligning. P (B), sandsynligheden for, at du har kræft, før du bliver testet, er en procent eller 0,01. Så er P (E), sandsynligheden for at du vil teste positiv. Fordi de er i henholdsvis tælleren og nævneren, annullerer de hinanden, og du er tilbage med P (B | E) = P (E | B) = 1. Hvis du tester positivt, har du bestemt kræft og vice omvendt.

I den virkelige verden er test sjældent eller aldrig helt pålidelige. Så lad os sige, at din test er 99 procent pålidelig.Det vil sige, 99 ud af 100 mennesker, der har kræft, vil teste positive, og 99 ud af 100, der er sunde, vil teste negative. Det er stadig en fantastisk test. Hvis din test er positiv, hvor sandsynligt er det, at du har kræft?

Nu viser Bayes sætning sin magt. De fleste antager, at svaret er 99 procent eller tæt på det. Det er, hvor pålidelig testen er, ikke? Men det rigtige svar, som Bayes sætning giver, er kun 50 procent.

Hvad med nævneren, P (E)? Her er hvor tingene bliver vanskelige. P (E) er sandsynligheden for at teste positivt, uanset om du har kræft eller ej. Med andre ord inkluderer det falske positive såvel som sande positive.

For at beregne sandsynligheden for en falsk positiv multiplicerer du antallet af falske positive, som er en procent eller 0,01 gange procentdelen af mennesker, der ikke har kræft, .99. Det samlede beløb er .0099. Ja, din fantastiske 99 procent nøjagtige test giver lige så mange falske positive som sande positive.

Lad os afslutte beregningen. For at få P (E) skal du tilføje sande og falske positive i alt .0198, som når de er opdelt i .0099 kommer til .5. Så endnu en gang er P (B | E), sandsynligheden for, at du har kræft, hvis du tester positivt, 50 procent.

Hvis du bliver testet igen, kan du reducere din usikkerhed enormt, fordi din sandsynlighed for at have kræft, P (B), er nu 50 procent snarere end en procent. Hvis din anden test også kommer positivt, fortæller Bayes sætning dig, at din sandsynlighed for at have kræft nu er 99 procent eller 0,99. Som dette eksempel viser, kan gentagelse af Bayes sætning give yderst præcis information.

Men hvis pålideligheden af din test er 90 procent, hvilket stadig er ret god, er dine chancer for faktisk at få kræft, selvom du tester positivt to gange er stadig mindre end 50 procent. (Tjek min matematik med den praktiske lommeregner i dette blogindlæg.)

De fleste mennesker, inklusive læger, har svært ved at forstå disse odds, hvilket hjælper med at forklare, hvorfor vi er overdiagnosticeret og overbehandlet for kræft og andre lidelser. Dette eksempel antyder, at Bayesians har ret: Verden ville faktisk være et bedre sted, hvis flere mennesker – eller i det mindste flere sundhedsforbrugere og udbydere – vedtog Bayesiansk ræsonnement.

På den anden side Bayes sætning er bare en kodifikation af sund fornuft. Som Yudkowsky skriver mod slutningen af sin tutorial: “På dette tidspunkt kan Bayes-sætning virke åbenlyst åbenlyst eller endda tautologisk, snarere end spændende og ny. Hvis det er tilfældet, har denne introduktion helt haft succes med sit formål. ”

Overvej kræftprøvningssagen: Bayes sætning siger, at din sandsynlighed for at have kræft, hvis du tester positivt, er sandsynligheden for en ægte positiv test divideret med sandsynligheden for alle positive tests, falske og sande. Kort sagt, pas på falske positive.

Her er min mere generelle erklæring om dette princip: Sandsynligheden for din tro afhænger af, i hvilken grad din tro – og kun din tro – forklarer beviset for det. Jo flere alternative forklaringer der er på beviserne, jo mindre sandsynlig er din tro. Dette er for mig essensen af Bayes sætning.

“Alternative forklaringer” kan omfatte mange ting. Din dokumentation kan være fejlagtig, skæv af et funktionsfejl i instrumentet, fejlbehæftet analyse, bekræftelsesforstyrrelse og endda svig. Dine beviser kan være sunde, men forklarbare af mange overbevisninger eller hypoteser, bortset fra din.

Med andre ord er der intet magisk ved Bayes sætning. Det koger ned til sandheden om, at din tro kun er så gyldig. som beviset. Hvis du har gode beviser, kan Bayes sætning give gode resultater. Hvis dit bevis er spinkelt, vil Bayes sætning ikke være til stor nytte. Affald ind, affald ud.

Potentialet for Bayes-misbrug begynder med P (B), dit oprindelige skøn over sandsynligheden for din tro, ofte kaldet “prior.” I kræftprøveeksemplet ovenfor fik vi en god, præcis prioritet på en procent eller 0,01 for forekomsten af kræft. I den virkelige verden er eksperter uenige i, hvordan man diagnosticerer og tæller kræft. Din prior vil ofte bestå af en række sandsynligheder snarere end et enkelt tal.

I mange tilfælde er det kun gætteri at estimere det foregående, så subjektive faktorer kan krybe ind i dine beregninger. Du gætter måske på sandsynligheden for noget, der – i modsætning til kræft – ikke engang eksisterer, såsom strenge, multivers, inflation eller Gud. Derefter kan du citere tvivlsomme beviser til støtte for din tvivlsomme tro. På denne måde kan Bayes sætning fremme pseudovidenskab og overtro såvel som fornuft.

Indlejret i Bayes sætning er et moralsk budskab: Hvis du ikke er omhyggelig med at søge alternative forklaringer på dit bevis, er beviset vil bare bekræfte, hvad du allerede tror på. Forskere undlader ofte ikke at følge dette diktum, hvilket hjælper med at forklare, hvorfor så mange videnskabelige påstande viser sig at være fejlagtige. Bayesians hævder, at deres metoder kan hjælpe forskere med at overvinde bekræftelsesforstyrrelser og producere mere pålidelige resultater, men jeg er i tvivl.

Og som jeg nævnte ovenfor omfavner nogle streng- og multiversentusiaster Bayesiansk analyse. Hvorfor? Fordi entusiasterne er trætte af at høre, at streng- og multiverse teorier er ufalsificerbare og dermed uvidenskabelige, og Bayes sætning giver dem mulighed for at præsentere teorierne i et mere gunstigt lys. I dette tilfælde muliggør Bayes sætning, langt fra at modvirke bekræftelsesforstyrrelse, det.

Som videnskabsforfatter Faye Flam for nylig udtrykte det i The New York Times, kan Bayesianske statistikker “ikke redde os fra dårlig videnskab. ” Bayes sætning er et alsidigt værktøj, der kan tjene enhver sag. Den fremtrædende Bayesiske statistiker Donald Rubin fra Harvard har fungeret som konsulent for tobaksvirksomheder, der står over for retssager om skader fra rygning.

Jeg er ikke desto mindre fascineret af Bayes sætning. Det minder mig om evolutionsteorien, en anden idé, der synes tautologisk enkel eller skræmmende dyb, afhængigt af hvordan du ser det, og som har inspireret til rigeligt vrøvl samt dyb indsigt.

Måske er det fordi min hjerne er Bayesian, men jeg er begyndt at opdage hentydninger til Bayes overalt. Mens jeg pløjede gennem Edgar Allen Poes Komplette værker på min Kindle for nylig, stødte jeg på denne sætning i Fortællingen om Arthur Gordon Pym fra Nantucket: “In no anliggender med kun fordomme, pro eller ulemper, udleder vi slutninger med fuld sikkerhed, selv fra de mest enkle data. ”

Husk Poes advarsel, inden du hopper på Bayes-vognen.

* Mine venner Greg, Gary og Chris scannede dette indlæg, før jeg s uplished det, så de skal beskyldes for eventuelle fejl.

Efterskrift: Andrew Gelman, en bayesisk statistiker i Columbia, til hvis blog jeg linker ovenfor (i bemærkningen om Donald Rubin), sendte mig denne anmodede kommentar : “Jeg arbejder med social- og miljøvidenskab og politik, ikke med teoretisk fysik, så jeg kan ikke rigtig kommentere på en eller anden måde brugen af Bayes til at argumentere for streng- og multiverse teorier! Jeg kan faktisk ikke lide indramningen, hvor resultatet er sandsynligheden for, at en hypotese er sand. Dette fungerer i nogle enkle indstillinger, hvor hypoteser eller muligheder er veldefinerede, for eksempel stavekontrol (se her: http://andrewgelman.com/2014/01/22/spell-checking-example/). Men jeg synes ikke det giver mening at tænke på sandsynligheden for, at en eller anden videnskabelig hypotese er sand eller falsk; se dette papir: http://andrewgelman.com/2014/01/22/spell-checking-example/. Kort sagt, jeg synes, at Bayesianske metoder er en fantastisk måde at udlede slutninger inden for en model på, men ikke generelt en god måde at vurdere sandsynligheden for, at en model eller hypotese er sand (jeg tror faktisk, sandsynligheden for, at en model eller en hypotese er sandt er generelt et meningsløst udsagn undtagen som bemærket i visse snævre om end vigtige eksempler). Jeg bemærkede også dette afsnit af dig: ‘I mange tilfælde er det kun gætteri at estimere det foregående, så subjektive faktorer kan krybe ind i dine beregninger. Du gætter måske på sandsynligheden for noget, der – i modsætning til kræft – ikke engang eksisterer, såsom strenge, multivers, inflation eller Gud. Derefter kan du citere tvivlsomme beviser til støtte for din tvivlsomme tro. På denne måde kan Bayes sætning fremme pseudovidenskab og overtro såvel som fornuft. Jeg synes dette citat er noget vildledende, idet alle dele af en model er subjektivt gætteri. Eller for at sige det på en anden måde skal hele en statistisk model forstås og evalueres. Jeg protesterer mod holdningen om, at datamodellen antages korrekt, mens den tidligere distribution er mistænkt. Her er noget, jeg skrev om emnet: http://andrewgelman.com/2015/01/27/perhaps-merely-accident-history-skeptics-subjectivists-alike-strain-gnat-prior-distribution-swallowing-camel-likelihood/. ”

Yderligere læsning:

Er Brains Bayesian?

Var jeg forkert om videnskabens afslutning?

En grave gennem gamle filer minder mig om, hvorfor jeg er så kritisk over for videnskab.

Undersøgelse afslører en fantastisk stigning i videnskabelig hype.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *