Bayesin lause: Mikä on suuri sopimus?

En ole varma, kun kuulin ensimmäisen kerran Bayesin lauseesta. Mutta aloin kiinnittää siihen huomiota vasta viime vuosikymmenen aikana, kun muutamat voitokkaammista opiskelijoistani mainitsivat sen melkein maagiseksi oppaaksi elämässä liikkumisessa.

Oppilaideni huhut hämmentivät minua, samoin kuin selitykset. lauseesta Wikipediassa ja muualla, jonka pidin joko liian tummennettuna tai liian monimutkaisena. Päätin kätevästi, että Bayes oli ohimenevä villitys, joka ei ole syytä syvempään tutkimiseen. Mutta nyt Bayes-kuume on tullut liian laajalle sivuuttamatta.

Bayesin tilastot ”aaltoilevat kaikesta fysiikasta syöpätutkimukseen, ekologiasta psykologiaan”, The New York Times kertoo. Fyysikot ovat ehdottaneet kvanttimekaniikan tulkintoja Bayesista Filosofit väittävät, että tiedettä kokonaisuutena voidaan pitää Bayesin prosessina ja että Bayes pystyy erottamaan tieteen pseudotieteestä tarkemmin kuin väärentäminen, Karl Popperin suosima menetelmä.

Keinotekoisen älykkyyden tutkijat, mukaan lukien Googlen itse ajavien autojen suunnittelijat, käyttävät Bayesin ohjelmistoa auttaakseen koneita tunnistamaan malleja ja tekemään päätöksiä. Bayesin ohjelmat, Bayesin lauseen suositun historian kirjoittajan Sharon Bertsch McGraynen mukaan, ”lajittelevat roskapostia sähköpostitse, arvioida lääketieteellisiä ja kotimaan turvallisuusriskejä ja purkaa muun muassa DNA. ” Fyysikko John Mather huolehtii verkkosivustolla Edge.org siitä, että Bayesin koneet saattavat olla niin älykkäitä, että ne tekevät ihmisistä ”vanhentuneita”.

Kognitiiviset tutkijat arvelevat, että aivomme sisällyttävät Bayesin algoritmeja, kun he havaitsevat, harkitsevat ja päättävät. Marraskuussa tutkijat ja filosofit tutkivat tätä mahdollisuutta New Yorkin yliopiston konferenssissa ”Onko aivot Bayesian?” (Keskustelen kokouksesta Bloggingheads.tv-ohjelmassa ja tässä seurantatekstissä ”Are Brains Bayesian?”)

Zealotit vaativat, että jos useampi meistä omaksui tietoisen Bayesin päättelyn (toisin kuin tajuton Bayesin käsittely) meidän aivojemme oletettavasti käyttävät), maailma olisi parempi paikka. ”Intuitiivisessa selityksessä Bayesin lauseesta” tekoälyn teoreetikko Eliezer Yudkowsky (jonka kanssa keskustelin kerran singulariteetista Bloggingheads.tv: ssä) tunnustaa bayesilaisten kulttisen kiihkon:

”Miksi matemaattinen käsite saa aikaan tämän outon innostuksen opiskelijoistaan? Mikä on ns. Bayesin vallankumous, joka nyt leviää tieteiden läpi, joka väittää, että jopa kokeellinen menetelmä on erikoistapauksena? salaisuus, jonka Bayesin kannattajat tietävät? Mikä on valo, jonka he ovat nähneet? Pian sinä tiedät. Pian sinä olet yksi meistä. ” Yudkowsky on tosissasi. Tai onko hän?

Kun otetaan huomioon kaikki tämä rengas, olen yrittänyt päästä lopullisesti Bayesin pohjalle. Löytämistäni lukemattomista selityksistä verkossa Erityisen hyödyllisiä ovat Yudkowskyn essee, Wikipedian artikkeli ja filosofi Curtis Brownin sekä tietojenkäsittelytieteen tutkijoiden Oscar Bonillan ja Kalid Azadin lyhyemmät kappaleet. Tässä viestissä yritän selittää – lähinnä omaksi eduksi – mitä Bayes on kyse. Luotan ystävällisiin lukijat huomauttavat, kuten tavallista, mahdollisista virheistä. *

Keksijänsä, 1700-luvun presbiterialaisen ministerin Thomas Bayesin mukaan nimetty Bayesin lause on menetelmä uskomusten (hypoteesien, väitteiden, parhaisiin käytettävissä oleviin todisteisiin (havainnot, tiedot, tiedot). Tässä on eniten tummennettu kuvaus: Alkuperäinen usko plus uusi näyttö = uusi ja parempi uskomus.

Tässä on täydellisempi versio: Todennäköisyys vakaumus on totta, kun uudet todisteet vastaavat todennäköisyyttä, että vakaumus on totta Näiden todisteiden määrä kertoo todennäköisyyden siitä, että todisteet ovat totta, kun otetaan huomioon, että vakaumus on totta, jaettuna todennäköisyydellä, että todisteet ovat totta riippumatta siitä, onko uskomus totta. Saitko?

Lääketieteellinen testaus palvelee usein kaavan osoittamista. Oletetaan, että sinut testataan syöpään, jonka arvioidaan esiintyvän prosentilla ikäsi ihmisistä. Jos testi on sataprosenttisen luotettava, et tarvitse Bayesin teoreemaa tietääksesi, mitä positiivinen testi tarkoittaa, mutta käytämme kuitenkin teoreemaa vain nähdäksesi, miten se toimii.

Ratkaise P: lle ( B | E), liität tiedot Bayesin yhtälön oikealle puolelle. P (B), todennäköisyys, että sinulla on syöpä ennen testejä, on yksi prosentti tai .01. Sama on P (E), todennäköisyys testistäsi positiiviseksi. Koska ne ovat vastaavasti osoittajassa ja nimittäjässä, ne peruuttavat toisensa, ja sinulle jää P (B | E) = P (E | B) = 1. Jos tulos on positiivinen, sinulla on varmasti syöpä ja päinvastoin päinvastoin.

Todellisessa maailmassa testit ovat harvoin, jos koskaan, täysin luotettavia. Oletetaan siis, että testisi on 99 prosenttia luotettava.Toisin sanoen 99 sadasta ihmisestä 100: lla on positiivinen, ja 99 terveestä 100: sta negatiivinen. Se on edelleen loistava testi. Jos testi on positiivinen, kuinka todennäköistä sinulla on syöpä?

Nyt Bayesin lause näyttää voimansa. Useimmat ihmiset olettavat vastauksen olevan 99 prosenttia tai lähellä sitä. Kuinka luotettava testi on, eikö? Mutta Bayesin lauseen antama oikea vastaus on vain 50 prosenttia.

Entä nimittäjä, P (E)? Täällä asiat muuttuvat hankaliksi. P (E) on todennäköisyys testata positiivisesti riippumatta siitä, onko sinulla syöpä. Toisin sanoen se sisältää sekä vääriä positiivisia että todellisia positiivisia.

Väärän positiivisen todennäköisyyden laskemiseksi kerrotaan väärien positiivisten prosenttiosuus, joka on yksi prosentti eli 0,01 kertaa prosenttiosuus. ihmisistä, joilla ei ole syöpää, .99. Yhteensä tulee .0099. Kyllä, upea, 99 prosentin tarkkuustesti tuottaa yhtä monta väärää positiivista kuin todellista positiivista.

Lopetetaan laskenta. Saadaksesi P (E), lisää tosi ja väärä positiivinen summa yhteensä 0,0198, joka jaettuna arvoon .0099 tulee .5. Joten jälleen kerran, P (B | E), todennäköisyys sairastua syöpään, jos testi on positiivinen, on 50 prosenttia.

Jos sinut testataan uudelleen, voit vähentää epävarmuutta valtavasti, koska todennäköisyys sairastua syöpä, P (B) on nyt 50 prosenttia eikä yksi prosentti. Jos myös toinen testi on positiivinen, Bayesin lause kertoo sinulle, että todennäköisyys saada syöpä on nyt 99 prosenttia eli 0,99. Kuten tämä esimerkki osoittaa, Bayesin lauseen toistaminen voi tuottaa erittäin tarkkaa tietoa.

Mutta jos testisi luotettavuus on 90 prosenttia, mikä on silti melko hyvä, mahdollisuutesi todellakin saada syöpä, vaikka testisi olisikin positiivinen kahdesti ovat edelleen alle 50 prosenttia. (Tarkista matematiikkani tämän blogikirjoituksen kätevällä laskimella.)

Suurimmalla osalla ihmisistä, myös lääkäreillä, on vaikea ymmärtää näitä kertoimia, mikä auttaa selittämään, miksi syitä ja muita sairauksia diagnosoidaan liikaa ja hoidetaan liikaa. Tämä esimerkki viittaa siihen, että Bayesialaiset ovat oikeassa: maailma olisi todellakin parempi paikka, jos useammat ihmiset – tai ainakin enemmän terveydenhuollon kuluttajia ja tarjoajia – omaksuisivat Bayesin perustelut.

Toisaalta Bayes lause on vain terveen järjen kodifikaatio. Kuten Yudkowsky kirjoittaa opetusohjelmansa loppupuolella: ”Tässä vaiheessa Bayes-lause voi tuntua räikeästi ilmeiseltä tai jopa tautologiselta eikä jännittävältä ja uudelta. Jos näin on, tämä johdanto on täysin onnistunut tarkoituksessaan. ”

Harkitse syöpätestaustapausta: Bayesin lause sanoo todennäköisyytesi saada syöpä, jos testit positiiviseksi, on todellisen positiivisen testin todennäköisyys jaettuna kaikkien positiivisten testien todennäköisyys, väärät ja totta. Lyhyesti sanottuna varokaa vääriä positiivisia.

Tässä on yleisempi toteamukseni tästä periaatteesta: Uskosi uskottavuus riippuu siitä, missä määrin uskosi – ja vain uskonne – selittää todisteet se. Mitä enemmän vaihtoehtoisia selityksiä todisteille on, sitä vähemmän uskottava olet. Minulle tämä on Bayesin lauseen ydin.

”Vaihtoehtoiset selitykset” voivat sisältää monia asioita. Todistuksesi saattavat olla virheellisiä, vääristyneiden laitteiden, viallisten analyysien, vahvistusasentojen, jopa petosten vääristämät. Todistuksesi saattavat olla vakaita, mutta selitettävissä monien muiden uskomusten tai hypoteesien lisäksi.

Toisin sanoen Bayesin lauseessa ei ole mitään maagista. Se johtuu totuudesta, että uskosi on vain yhtä pätevä Jos sinulla on hyviä todisteita, Bayesin lause voi tuottaa hyviä tuloksia. Jos todisteet ovat hämärät, Bayesin lauseesta ei ole paljon hyötyä. Roskat sisään, roskat pois.

Mahdollisuudet Bayesin väärinkäyttö alkaa P (B): llä, joka on ensimmäinen arvio uskosi todennäköisyydestä, jota usein kutsutaan ”prioriksi”. Yllä olevassa syöpäkoe-esimerkissä meille annettiin mukava, tarkka prosenttiosuus tai 0,01 syövän esiintyvyydelle. Todellisessa maailmassa asiantuntijat ovat eri mieltä siitä, miten syöpä diagnosoidaan ja lasketaan. Aikaisempi koostuu usein todennäköisyyksien alueesta eikä yhdestä luvusta.

Monissa tapauksissa priorin arvioiminen on vain arvaus, jonka avulla subjektiiviset tekijät voivat hiipiä laskelmissasi. Saatat arvata sellaisen todennäköisyyttä, jota – toisin kuin syöpä – ei edes ole, kuten jouset, multiversumit, inflaatio tai Jumala. Voit sitten mainita epäilyttävät todisteet epäilyttävän uskosi tueksi. Tällä tavoin Bayesin lause voi edistää näennäistieteitä ja taikauskoa sekä järkeä.

Bayesin lause on upotettu moraaliseen viestiin: Jos et ole tarkkana etsimällä todisteille vaihtoehtoisia selityksiä, todisteet vain vahvistaa mitä jo uskot. Tutkijat eivät usein noudata tätä sanelua, mikä auttaa selittämään, miksi niin monet tieteelliset väitteet osoittautuvat virheellisiksi. Bayesilaiset väittävät, että heidän menetelmänsä voivat auttaa tutkijoita voittamaan vahvistusvirheen ja tuottamaan luotettavampia tuloksia, mutta minulla on epäilyksiä.

Ja kuten edellä mainitsin, jotkut merkkijono- ja multiversumiharrastajat omaksuvat Bayesin analyysin. Miksi? Koska harrastajat ovat kyllästyneet kuulemaan, että merkkijono- ja multiversumiteoriat ovat muuttumattomia ja siten tieteettömiä, ja Bayesin lause antaa heille mahdollisuuden esittää teoriat suotuisammassa valossa. Tässä tapauksessa Bayesin lause, joka ei suinkaan estä vahvistusbiaseja, mahdollistaa sen.

Kuten tiedekirjoittaja Faye Flam sanoi äskettäin The New York Times -lehdessä, Bayesin tilastot ”eivät voi pelastaa meitä huonoista tiedeistä. ” Bayesin lause on yleiskäyttöinen työkalu, joka voi palvella mitä tahansa syytä. Tunnettu Bayesin tilastotieteilijä Donald Rubin Harvardista on toiminut konsulttina tupakkayhtiöille, jotka joutuvat syytteisiin tupakoinnin vahingoista.

Olen kuitenkin kiehtonut Bayesin lause. Se muistuttaa minua evoluutioteoriasta, toisesta ajatuksesta, joka vaikuttaa tautologisesti yksinkertaiselta tai pelottavan syvältä, riippuen siitä, miten katsot sitä, ja joka on inspiroinut runsaasti hölynpölyä ja syvällisiä oivalluksia.

Ehkä se johtuu siitä, että aivoni ovat Bayesilaisia, mutta olen alkanut havaita viittauksia Bayesiin kaikkialla. Kun äskettäin kynnin Edgar Allen Poen kokonaisia teoksia Kindle-ohjelmassa, törmäsin tähän lauseeseen Nantucketin Arthur Gordon Pymin kertomuksessa: ”Ei missään pelkästään ennakkoluulot, pro vai con, johtaako johtopäätökset täysin varmasti, jopa yksinkertaisimmista tiedoista. ”

Pidä Poen huomautus mielessä ennen kuin hyppäät Bayes-vaunulle.

* Ystäväni Greg, Gary ja Chris skannasivat tämän viestin ennen kuin minä s uppasi sitä, joten heitä pitäisi syyttää virheistä.

Jälkikirjoitus: Andrew Gelman, Bayesian tilastotieteilijä Columbiassa, jonka blogiin linkin yllä (Donald Rubinin huomautuksessa), lähetti minulle tämän pyytämän kommentin. : ”Työskentelen sosiaali- ja ympäristötieteiden ja politiikan parissa, en teoreettisen fysiikan parissa, joten en voi todellakaan kommentoida tavalla tai toisella Bayesin käyttöä kiistellessäsi merkkijono- ja moninaisuusteorioiden puolesta! En todellakaan pidä kehyksestä, jossa tulos on todennäköisyys hypoteesin totta. Tämä toimii joissakin yksinkertaisissa asetuksissa, joissa hypoteesit tai mahdollisuudet on määritelty hyvin, esimerkiksi oikeinkirjoituksen tarkistus (katso täältä: http://andrewgelman.com/2014/01/22/spell-checking-example/). Mutta mielestäni ei ole järkevää ajatella todennäköisyyttä, että jokin tieteellinen hypoteesi on totta tai väärä; katso tämä artikkeli: http://andrewgelman.com/2014/01/22/spell-checking-example/. Lyhyesti sanottuna mielestäni Bayesin menetelmät ovat loistava tapa tehdä päätelmiä mallissa, mutta eivät yleensä hyvä tapa arvioida todennäköisyyttä, että malli tai hypoteesi on totta (todellakin luulen, että malli tai hypoteesi on todennäköinen) on totta on yleensä merkityksetön lausunto, paitsi tietyissä kapeissa, vaikkakin tärkeissä esimerkeissä mainituista. Huomasin myös tämän kappaleen: ”Monissa tapauksissa priorin arvioiminen on vain arvaus, jonka avulla subjektiiviset tekijät voivat hiipiä laskelmissasi. Saatat arvata sellaisen todennäköisyyttä, jota – toisin kuin syöpä – ei edes ole, kuten jouset, multiversumit, inflaatio tai Jumala. Voit sitten mainita epäilyttävät todisteet epäilyttävän uskosi tueksi. Tällä tavoin Bayesin lause voi edistää näennäistieteitä ja taikauskoa sekä järkeä. ”Mielestäni tämä lainaus on jonkin verran harhaanjohtava, koska mallin kaikki osat ovat subjektiivisia arvailuja. Tai toisin sanoen, kaikki tilastomallit on ymmärrettävä ja arvioitava. Vastustan asennetta, jonka mukaan tietomallin oletetaan olevan oikea, kun aikaisempi jakelu on epäiltyä. Tässä on asia, jonka kirjoitin aiheesta: http://andrewgelman.com/2015/01/27/perhaps-merely-accident-history-skeptics-subjectivists-alike-strain-gnat-prior-distribution-swallowing-camel-likelihood/. ”

Lue lisää:

Ovatko aivot Bayesilaisia?

Oliko väärässä tieteen loppu?

Kaivaminen vanhojen tiedostojen läpi muistuttaa minua siitä, miksi olen kriittinen tieteen suhteen.

Tutkimus paljastaa hämmästyttävän nousun tieteellisessä hypeessä.

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *