Bayes-tétel: Mi a nagy ügy?

Nem vagyok biztos benne, amikor először hallottam Bayes-tételről. De csak az elmúlt évtizedben kezdtem igazán figyelni rá, miután néhány győztes hallgatóm szinte mágikus útmutatóként emlegette az életben való eligazodást.

A hallgatóim dühöngései zavartak, csakúgy, mint a magyarázatok. tétele a Wikipédián és másutt, amelyet vagy túl lebutítottnak vagy túl bonyolultnak találtam. Kényelmesen eldöntöttem, hogy Bayes múló divat, nem érdemes mélyebb vizsgálódni. De most a Bayes-láz túlságosan elterjedt ahhoz, hogy figyelmen kívül hagyhassa.

A Bayesi statisztikák “a fizikától kezdve a rákkutatásig, az ökológiától a pszichológiáig mindent átjárnak” – írja a The New York Times. A fizikusok a kvantummechanika bayesi értelmezését javasolták. valamint a húr- és multiverzális elméletek bayesi védelme. A filozófusok azt állítják, hogy a tudomány egésze Bayes-folyamatnak tekinthető, és hogy Bayes pontosabban meg tudja különböztetni a tudományt az áltudománytól, mint a hamisítást, a módszert, amelyet Karl Popper népszerűsített.

A mesterséges intelligencia kutatói, köztük a Google önvezető autóinak tervezői, Bayes-i szoftver segítségével segítik a gépeket a minták felismerésében és a döntések meghozatalában. A Bayes-i programok Sharon Bertsch McGrayne, a Bayes-tétel népszerű történetének szerzője szerint “spameket rendeznek e-mailből, felméri többek között az orvosi és a belbiztonsági kockázatokat, és dekódolja a DNS-t. ” Az Edge.org weboldalon John Mather fizikus azon gondolkodik, hogy a Bayes-i gépek olyan intelligensek lehetnek, hogy az embereket “elavulttá” teszik.

Kognitív tudósok sejtik, hogy agyunk beépíti a Bayes-i algoritmusokat, amikor észlelik, megfontolják, döntik. Novemberben a tudósok és filozófusok ezt a lehetőséget vizsgálták a New York-i Egyetemen tartott konferencián “Az agy Bayes-i?” (A megbeszélést a Bloggingheads.tv-n tárgyalom, és ebben a folytatásban: “Agyak Bayes-ösek?”)

A zelóták ragaszkodnak ahhoz, hogy ha többen alkalmaznánk tudatos bayesi érvelést (szemben a tudattalan bayesi feldolgozással). állítólag az agyunk foglalkoztatja), a világ jobb hely lenne. A “Bayes-tétel intuitív magyarázatában” Eliezer Yudkowsky AI-elméleti szakember (akivel egyszer a Singularityt a Bloggingheads.tv-n vitattam meg) elismeri a Bayes-i emberek kultikus hévét:

“Miért generálja ezt a furcsa lelkesedést hallgatóiban egy matematikai koncepció? Mi az, amit a tudományokon végigsöpör az úgynevezett bayesi forradalom, amely azt állítja, hogy még magát a kísérleti módszert is különleges esetnek szánja?” titok, amelyet Bayes hívei tudnak? Mi a fény, amit láttak? Hamarosan megtudja. Hamarosan Ön is köztünk lesz. ” Yudkowsky viccelődik. Vagy mégis?

Mindezeket a körmöket figyelembe véve egyszer és mindenkorra megpróbáltam eljutni a Bayes aljára. A weben található számtalan magyarázat közül találtam Különösen hasznos Yudkowsky esszéje, a Wikipedia bejegyzése, valamint Curtis Brown filozófus, valamint Oscar Bonilla és Kalid Azad számítástechnikusok rövidebb írásai. Ebben a bejegyzésben megpróbálom – elsősorban saját hasznomra – elmagyarázni, hogy miről is szól Bayes. Az olvasók szokás szerint felhívják a figyelmet a hibákra. *

A feltalálójáról, Thomas Bayes 18. századi presbiteri miniszterről elnevezett Bayes-tétel a hiedelmek (hipotézisek, állítások, javaslatok) a rendelkezésre álló legjobb bizonyítékokon (megfigyelések, adatok, információk) alapulnak. Az alábbiakban bemutatjuk a legbutítottabb leírást: Kezdeti meggyőződés plusz új bizonyítékok = új és továbbfejlesztett meggyőződés. a meggyőződés igaz, ha új bizonyítékok megegyeznek annak valószínűségével, hogy a meggyőződés valódi tekintet Ennek a bizonyítéknak a valószínűsége, hogy a bizonyíték igaz, figyelembe véve, hogy a meggyőződés igaz, elosztva annak valószínűségével, hogy a bizonyíték igaz, függetlenül attól, hogy a hit igaz. Megvan?

Az orvosi vizsgálatok gyakran szolgálnak a képlet bemutatására. Tegyük fel, hogy rákos megbetegedéseket tesztelnek, amelyek a becslések szerint az Ön korának egy százalékában fordulnak elő. Ha a teszt 100% -ban megbízható, akkor nincs szükséged Bayes tételére, hogy tudd, mit jelent a pozitív teszt, de használjuk a tételt mindenképpen, csak azért, hogy lássuk, hogyan működik.

P ( B | E), az adatokat Bayes-egyenletének jobb oldalára csatlakoztatja. P (B), annak valószínűsége, hogy rákban szenved a tesztelés előtt, egy százalék, vagy .01. Így van P (E) is, annak valószínűsége, hogy pozitív lesz a teszt. Mivel a számlálóban és a nevezőben vannak, törlik egymást, és akkor marad a P (B | E) = P (E | B) = 1. Ha pozitív eredményt ad, akkor mindenképpen rákja van, és fordítva fordítva.

A való világban a tesztek ritkán, ha valaha is teljesen megbízhatóak. Tehát tegyük fel, hogy tesztje 99 százalékban megbízható.Vagyis 100 rákos emberből 99 pozitív, 100 egészségesből pedig 99 negatív. Ez még mindig félelmetes teszt. Ha tesztje pozitív, mennyire valószínű, hogy rákja van?

Most Bayes-tétel megmutatja erejét. A legtöbb ember feltételezi, hogy a válasz 99 százalékos, vagy közel áll hozzá. Ennyire megbízható a teszt, igaz? De a helyes válasz, amelyet Bayes tétele adott, csak 50 százalék.

Mi a helyzet a nevezővel, P (E)? Itt alakulnak a dolgok bonyolulttá. P (E) a pozitív teszt valószínűsége, függetlenül attól, hogy rákos-e. Más szavakkal, hamis pozitívakat és valódi pozitívakat is tartalmaz.

A hamis pozitív valószínűségének kiszámításához meg kell szorozni a hamis pozitívok arányát, amely egy százalék, vagy 0,01 szorosa a százaléknak azok közül, akiknek nincs rákja, .99. A teljes érték 0000. Igen, a félelmetes, 99 százalékos pontosságú tesztje annyi hamis pozitív eredményt ad, mint valódi pozitív.

Fejezzük be a számítást. Ahhoz, hogy P (E) -et kapjunk, adjunk igaz és hamis pozitív eredményeket összesen 0,0198 értékre, ami, ha 0,0099-re osztjuk, akkor értéke 5. Tehát még egyszer: P (B | E), annak valószínűsége, hogy rákos, ha pozitív a tesztje, 50 százalék.

Ha újra teszteljük, óriási mértékben csökkenthetjük a bizonytalanságot, mert a a rákos megbetegedés, a P (B) most 50 százalék, nem pedig egy százalék. Ha a második teszted is pozitív lesz, Bayes-tétel azt mondja, hogy a rákos megbetegedés valószínűsége most 99 százalék, vagyis 0,99. Mint ez a példa mutatja, a Bayes-tétel ismétlése rendkívül pontos információkat eredményezhet.

De ha a teszt megbízhatósága 90 százalékos, ami még mindig nagyon jó, akkor esélye van arra, hogy valóban rákos legyen, még akkor is, ha pozitív tesztet végez kétszer még mindig kevesebb, mint 50 százalék. (Ellenőrizze a matematikámat a praktikus számológéppel ebben a blogbejegyzésben.)

A legtöbb embernek, beleértve az orvosokat is, nehéz megértenie ezeket az esélyeket, ami segít megmagyarázni, miért diagnosztizálnak minket túlzottan és túlkezeltek rák és egyéb rendellenességek miatt. Ez a példa arra utal, hogy a bayesiánusoknak igazuk van: a világ valóban jobb hely lenne, ha több ember – vagy legalábbis több egészségügyi fogyasztó és szolgáltató – elfogadná a bayesi érvelést.

Másrészt a Bayes a tétel csak a józan ész kodifikációja. Amint Yudkowsky oktatóanyagának vége felé írja: „Ekkorra a Bayes-tétel nyilvánvalóan nyilvánvalónak vagy tautologikusnak tűnhet, nem pedig izgalmasnak és újnak. Ha igen, akkor ez a bevezetés teljesen sikeres volt. “

Vizsgáljuk meg a rákteszt-esetet: Bayes-tétel szerint a pozitív rákos megbetegedés valószínűsége pozitív teszt esetén a valódi pozitív teszt valószínűsége osztva minden pozitív teszt valószínűsége, hamis és igaz. Röviden, óvakodjon a hamis pozitív eredményektől.

Íme az általánosabb megállapításom erről az elvről: Hiedelmének hitelessége attól függ, hogy a hite – és csak a hite – milyen mértékben magyarázza a bizonyítékokat azt. Minél több alternatív magyarázat létezik a bizonyítékokra, annál kevésbé hihető a meggyőződése. Számomra ez a Bayes-tétel lényege.

Az „alternatív magyarázatok” sok mindent felölelhetnek. Bizonyítékai tévesek lehetnek, torzíthatók egy hibásan működő eszközzel, hibás elemzéssel, megerősítési elfogultsággal, sőt csalással. Bizonyítékaid megalapozottak lehetnek, de sok meggyőződés vagy hipotézis megmagyarázható, kivéve a tiédet.

Más szavakkal, Bayes tételében nincs semmi varázslat. Annak a valóságnak a forrása, hogy a meggyőződésed csak annyira érvényes mint bizonyíték. Ha van jó bizonyítéka, a Bayes-tétel jó eredményeket hozhat. Ha bizonyítékai gyengék, a Bayes-tétel nem sok hasznát veszi. Szemét be, szemét ki.

A potenciál mert a Bayes-bántalmazás P (B) -vel kezdődik, a hitének valószínűségére vonatkozó első becslés, amelyet gyakran “priornak” neveznek. A fenti rákteszt-példában szép, pontos egy százalékot, vagy 0,01-et kaptunk a rák előfordulására vonatkozóan. A való világban a szakértők nem értenek egyet abban, hogyan lehet diagnosztizálni és megszámolni a rákokat. Előzete gyakran egy valószínűség tartományából áll, nem pedig egyetlen számból.

Sok esetben a prior becslése csak találgatás, lehetővé téve a szubjektív tényezők behatolását a számításokba. Lehet, hogy sejted annak a valószínűségét, amely – a rákkal ellentétben – nem is létezik, például húrok, multiverzumok, infláció vagy Isten. Ezután kétes bizonyítékokat idézhet a kétes hitének alátámasztására. Így Bayes-tétel elősegítheti az áltudományt és a babonát, valamint az értelmet.

A Bayes-tételbe beágyazva erkölcsi üzenet: Ha nem szorgalmasan keres alternatív magyarázatokat a bizonyítékokra, a bizonyítékokat csak megerősíti azt, amiben már hiszel. A tudósok gyakran nem veszik figyelembe ezt a diktumot, ami megmagyarázza, miért bizonyul sok tudományos állítás tévesnek. A Bayes-i állítások szerint módszereik segíthetnek a tudósoknak a megerősítési elfogultság leküzdésében és megbízhatóbb eredmények elérésében, de kétségeim vannak.

És ahogy fentebb említettem, néhány húr- és multiverzum rajongó átfogja a Bayes-elemzést. Miért? Mivel a rajongóknak elegük van hallani, hogy a húr- és multiverzumelméletek nem mérhetőek, és ezért tudománytalanok, és Bayes-tétel lehetővé teszi számukra, hogy az elméleteket kedvezőbb megvilágításban mutassák be. Ebben az esetben a Bayes-tétel, amely messze nem ellensúlyozza a megerősítési elfogultságot, lehetővé teszi ezt. ” A Bayes-tétel egy univerzális eszköz, amely bármilyen célt szolgálhat. A prominens bayesi statisztikus, Harvardból származó Donald Rubin tanácsadóként szolgált azoknak a dohányipari vállalatoknak, akik a dohányzásból eredő károk miatt pert indítanak.

Mindazonáltal lenyűgözött. Bayes tételével emlékeztet az evolúció elméletére, egy másik gondolatra, amely tautológiailag egyszerűnek vagy ijesztően mélynek tűnik, attól függően, hogy hogyan tekintesz rá, és amely rengeteg ostobaságot és mély meglátást ihletett.

Talán azért, mert az agyam Bayes-i, de kezdtem mindenhol észlelni a Bayes-re utaló utalásokat. Miközben nemrégiben Edgar Allen Poe teljes műveit szántottam Kindle-en, a The Nantucket-i Arthur Gordon Pym elbeszélésében erre a mondatra bukkantam: pusztán előítéletek, pro vagy con, a legegyszerűbb adatokból is teljes bizonyossággal következtetünk-e a következtetésekre. ”

Ne felejtsük el Poe figyelmeztetését, mielőtt felugrunk a Bayes-kocsira.

* Barátaim, Greg, Gary és Chris, mielőtt p elrontotta, ezért hibáztatni kell őket az esetleges hibákért.

Utóirat: Andrew Gelman, a kolumbiai bayesi statisztikus, akinek blogját fentebb linkelem (Donald Rubin megjegyzésében), elküldte nekem ezt a megkért megjegyzést. : “Társadalom- és környezettudattal és politikával foglalkozom, nem az elméleti fizikával, így nem igazán tudok kommentálni így vagy úgy Bayes-t, hogy a húr- és multiverzális elméletek mellett érveljek! Igazából nem szeretem azt a keretezést, amelyben az eredmény annak a valószínűsége, hogy egy hipotézis igaz. Ez néhány egyszerű beállításban működik, ahol a „hipotézisek” vagy a lehetőségek jól körülhatárolhatók, például a helyesírás-ellenőrzés (lásd itt: http://andrewgelman.com/2014/01/22/spell-checking-example/). De szerintem nincs értelme arra gondolni, hogy valamilyen tudományos hipotézis igaz vagy hamis; lásd ezt a cikket: http://andrewgelman.com/2014/01/22/spell-checking-example/. Röviden, azt gondolom, hogy a Bayes-módszerek nagyszerű módja a következtetések meghozatalának a modellen belül, de általában nem jó módszer annak valószínűségének felmérésére, hogy egy modell vagy hipotézis igaz (sőt, azt hiszem, annak a valószínűsége, hogy egy modell vagy egy hipotézis igaz “általában értelmetlen állítás, kivéve, ha bizonyos szűk, bár fontos példákban megjegyeztük). Észrevettem ezt a bekezdésedet is: „Sok esetben a prior becslése csak találgatás, amely lehetővé teszi, hogy a szubjektív tényezők bekúszjanak a számításokba. Lehet, hogy sejted annak a valószínűségét, amely – a rákkal ellentétben – nem is létezik, például húrok, multiverzumok, infláció vagy Isten. Ezután kétes bizonyítékokat idézhet a kétes hitének alátámasztására. Ily módon Bayes tétele elősegítheti az áltudományt és a babonát, valamint az értelmet. ”Úgy gondolom, hogy ez az idézet kissé félrevezető, mivel a modell minden része szubjektív tippelés. Vagy másképpen fogalmazva, az összes statisztikai modellt meg kell érteni és értékelni kell. Kifogásolom azt a hozzáállást, miszerint az adatmodellt feltételezzük helyesnek, miközben az előzetes terjesztés gyanús. Íme valami, amit a témában írtam: http://andrewgelman.com/2015/01/27/perhaps-merely-accident-history-skeptics-subjectivists-alike-strain-gnat-prior-distribution-swallowing-camel-likelihood/. ”

További olvasnivalók:

Agyak Bayes-i?

Tévedtem a tudomány végével kapcsolatban?

A régi fájlok átfutása emlékeztet arra, hogy miért vagyok annyira kritikus a tudományról.

A tanulmány elképesztő túlfeszültséget tár fel a tudományos hipóban.

Vélemény, hozzászólás?

Az email címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük