Non sono sicuro quando ho sentito parlare per la prima volta del teorema di Bayes. Ma ho davvero iniziato a prestarvi attenzione solo negli ultimi dieci anni, dopo che alcuni dei miei studenti più stravaganti lhanno pubblicizzato come una guida quasi magica per navigare nella vita.
Le invettive dei miei studenti mi hanno confuso, così come le spiegazioni del teorema su Wikipedia e altrove, che ho trovato troppo stupido o troppo complicato. Decisi opportunamente che Bayes fosse una moda passeggera, non degna di unindagine più approfondita. Ma ora la febbre di Bayes è diventata troppo pervasiva per essere ignorata.
Le statistiche bayesiane “stanno attraversando tutto, dalla fisica alla ricerca sul cancro, dallecologia alla psicologia”, riferisce il New York Times. I fisici hanno proposto interpretazioni bayesiane della meccanica quantistica e le difese bayesiane delle teorie delle stringhe e del multiverso. I filosofi affermano che la scienza nel suo insieme può essere vista come un processo bayesiano e che Bayes può distinguere la scienza dalla pseudoscienza più precisamente della falsificazione, il metodo reso popolare da Karl Popper.
I ricercatori di intelligenza artificiale, inclusi i progettisti delle auto a guida autonoma di Google, utilizzano software bayesiano per aiutare le macchine a riconoscere schemi e prendere decisioni. I programmi bayesiani, secondo Sharon Bertsch McGrayne, autrice di una famosa storia del teorema di Bayes, “sort spam dalla posta elettronica, valutare i rischi medici e per la sicurezza nazionale e decodificare il DNA, tra le altre cose “. Sul sito Web Edge.org, il fisico John Mather teme che le macchine bayesiane possano essere così intelligenti da rendere gli esseri umani “obsoleti”.
Gli scienziati cognitivi ipotizzano che i nostri cervelli incorporino algoritmi bayesiani mentre percepiscono, deliberano, decidono. A novembre, scienziati e filosofi hanno esplorato questa possibilità in una conferenza alla New York University intitolata “Is the Brain Bayesian?” (Discuto dellincontro su Bloggingheads.tv e in questo post di follow-up, “I cervelli sono bayesiani?”)
Gli zeloti insistono sul fatto che se più di noi adottassero il ragionamento bayesiano cosciente (in opposizione allelaborazione bayesiana inconscia i nostri cervelli presumibilmente impiegano), il mondo sarebbe un posto migliore. In “An Intuitive Explanation of Bayes Theorem”, il teorico dellIA Eliezer Yudkowsky (con cui una volta ho discusso la Singolarità su Bloggingheads.tv) riconosce il fervore cultuale dei bayesiani:
“Perché un concetto matematico genera questo strano entusiasmo nei suoi studenti? Cosè la cosiddetta rivoluzione bayesiana che sta attraversando le scienze, che pretende di includere anche il metodo sperimentale stesso come un caso speciale? Qual è il segreto che gli aderenti di Bayes conoscono? Qual è la luce che hanno visto? Presto lo saprai. Presto sarai uno di noi “. Yudkowsky sta scherzando. O lo è?
Dato tutto questo trambusto, ho cercato di arrivare al fondo di Bayes, una volta per tutte. Delle innumerevoli spiegazioni sul web, quelle che ho trovato particolarmente utili includono il saggio di Yudkowsky, la voce di Wikipedia e pezzi più brevi del filosofo Curtis Brown e degli scienziati informatici Oscar Bonilla e Kalid Azad. In questo post cercherò di spiegare, principalmente a mio vantaggio, di cosa tratta Bayes. i lettori, come al solito, segnaleranno eventuali errori. *
Prende il nome dal suo inventore, il ministro presbiteriano del XVIII secolo Thomas Bayes, il teorema di Bayes è un metodo per calcolare la validità delle credenze (ipotesi, affermazioni, proposizioni) basate sulle migliori prove disponibili (osservazioni, dati, informazioni). Ecco la descrizione più stupida: convinzione iniziale più nuove prove = convinzione nuova e migliorata.
Ecco una versione più completa: la probabilità che una credenza è vera se nuove prove equivalgono alla probabilità che la credenza sia vera riguardo a s di quellevidenza moltiplicata la probabilità che levidenza sia vera dato che la convinzione è vera divisa per la probabilità che levidenza sia vera indipendentemente dal fatto che la convinzione sia vera. Capito?
I test medici servono spesso a dimostrare la formula. Supponiamo che tu venga sottoposto a test per un cancro che si stima si manifesti nelluno per cento delle persone della tua età. Se il test è affidabile al 100%, non è necessario il teorema di Bayes per sapere cosa significa un test positivo, ma usiamo comunque il teorema, solo per vedere come funziona.
Per risolvere per P ( B | E), inserisci i dati nella parte destra dellequazione di Bayes. P (B), la probabilità che tu abbia il cancro prima di fare il test, è delluno percento, o 0,01. Così è P (E), la probabilità che risulti positivo. Poiché sono rispettivamente al numeratore e al denominatore, si annullano a vicenda e ti rimane P (B | E) = P (E | B) = 1. Se risulti positivo, hai sicuramente il cancro, e viceversa viceversa.
Nel mondo reale, i test sono raramente se non del tutto affidabili. Quindi supponiamo che il tuo test sia affidabile al 99%.Cioè, 99 persone su 100 che hanno il cancro risulteranno positive al test e 99 su 100 che sono sane risulteranno negative. È ancora un test formidabile. Se il tuo test è positivo, quanto è probabile che tu abbia il cancro?
Ora il teorema di Bayes mostra la sua potenza. La maggior parte delle persone presume che la risposta sia il 99 percento o quasi. Questo è quanto è affidabile il test, giusto? Ma la risposta corretta, fornita dal teorema di Bayes, è solo del 50 percento.
E il denominatore, P (E)? Qui è dove le cose si complicano. P (E) è la probabilità di risultare positivo indipendentemente dal fatto che tu abbia o meno il cancro. In altre parole, include sia i falsi positivi che i veri positivi.
Per calcolare la probabilità di un falso positivo, moltiplichi la percentuale di falsi positivi, che è uno percento, o 0,01, per la percentuale di persone che non hanno il cancro, .99. Il totale è di 0,0099. Sì, il tuo fantastico test accurato al 99% produce tanti falsi positivi quanti veri positivi.
Terminiamo il calcolo. Per ottenere P (E), aggiungi veri e falsi positivi per un totale di .0198, che se diviso in .0099 arriva a .5. Quindi, ancora una volta, P (B | E), la probabilità che tu abbia il cancro se risulti positivo al test, è del 50%.
Se esegui di nuovo il test, puoi ridurre enormemente la tua incertezza, perché la tua probabilità di avere il cancro, P (B), è ora del 50 percento anziché delluno percento. Se anche il tuo secondo test risulta positivo, il teorema di Bayes ti dice che la tua probabilità di avere il cancro è ora del 99 percento, o 0,99. Come mostra questo esempio, literazione del teorema di Bayes può fornire informazioni estremamente precise.
Ma se laffidabilità del tuo test è del 90 percento, che è ancora abbastanza buono, le tue possibilità di avere effettivamente il cancro anche se risulti positivo due volte sono ancora meno del 50 percento. (Controlla i miei calcoli con la pratica calcolatrice in questo post del blog.)
La maggior parte delle persone, compresi i medici, ha difficoltà a comprendere queste probabilità, il che aiuta a spiegare perché siamo sovradiagnosticati e trattati eccessivamente per il cancro e altri disturbi. Questo esempio suggerisce che i bayesiani hanno ragione: il mondo sarebbe davvero un posto migliore se più persone, o almeno più consumatori e fornitori di servizi sanitari, adottassero il ragionamento bayesiano.
Daltra parte, Bayes teorema è solo una codificazione del buon senso. Come scrive Yudkowsky verso la fine del suo tutorial: “A questo punto, il teorema di Bayes” può sembrare palesemente ovvio o addirittura tautologico, piuttosto che eccitante e nuovo. Se è così, questa introduzione è riuscita completamente nel suo scopo. “
Considera il caso del test del cancro: il teorema di Bayes dice che la tua probabilità di avere il cancro se risulti positivo è la probabilità di un vero test positivo divisa per la probabilità di tutti i test positivi, falsi e veri. In breve, fai attenzione ai falsi positivi.
Ecco la mia dichiarazione più generale di quel principio: la plausibilità della tua convinzione dipende dal grado in cui la tua convinzione – e solo la tua convinzione – spiega le prove per esso. Più spiegazioni alternative ci sono per le prove, meno plausibile è la tua convinzione. Questa, per me, è lessenza del teorema di Bayes.
“Spiegazioni alternative” può comprendere molte cose. Le tue prove potrebbero essere errate, distorte da uno strumento malfunzionante, analisi difettosa, bias di conferma, persino frode. Le tue prove potrebbero essere valide ma spiegabili da molte credenze, o ipotesi, diverse dalle tue.
In altre parole, non cè nulla di magico nel teorema di Bayes. Si riduce alla verità lapalissiana che la tua convinzione è altrettanto valida come sua prova. Se hai una buona evidenza, il teorema di Bayes può dare buoni risultati. Se la tua evidenza è fragile, il teorema di Bayes non sarà di grande utilità. Garbage in, garbage out.
Il potenziale per Bayes labuso inizia con P (B), la stima iniziale della probabilità della tua convinzione, spesso chiamata “precedente”. Nellesempio del test del cancro sopra, ci è stato dato un bel precedente preciso dell1%, o 0,01, per la prevalenza del cancro. Nel mondo reale, gli esperti non sono daccordo su come diagnosticare e contare i tumori. Il tuo precedente sarà spesso costituito da un intervallo di probabilità piuttosto che da un singolo numero.
In molti casi, la stima del precedente è solo supposizione, consentendo a fattori soggettivi di insinuarsi nei tuoi calcoli. Potresti indovinare la probabilità di qualcosa che, a differenza del cancro, non esiste nemmeno, come gli archi, i multiversi, linflazione o Dio. Potresti quindi citare prove dubbie a sostegno della tua dubbia convinzione. In questo modo, il teorema di Bayes può promuovere la pseudoscienza e la superstizione così come la ragione.
Incorporato nel teorema di Bayes cè un messaggio morale: se non sei scrupoloso nel cercare spiegazioni alternative per le tue prove, le prove confermerà solo ciò in cui già credi. Gli scienziati spesso non tengono conto di questo detto, il che aiuta a spiegare perché così tante affermazioni scientifiche si rivelano errate. I bayesiani affermano che i loro metodi possono aiutare gli scienziati a superare i pregiudizi di conferma e produrre risultati più affidabili, ma ho i miei dubbi.
E come ho già detto, alcuni appassionati di stringhe e multiverso stanno abbracciando lanalisi bayesiana. Perché? Perché gli appassionati sono stanchi di sentire che le teorie sulle stringhe e sul multiverso sono infalsificabili e quindi non scientifiche, e il teorema di Bayes consente loro di presentare le teorie in una luce più favorevole. In questo caso, il teorema di Bayes, lungi dal contrastare il bias di conferma, lo consente.
Come lo scrittore scientifico Faye Flam ha recentemente affermato sul New York Times, le statistiche bayesiane “non possono salvarci dalla cattiva scienza. ” Il teorema di Bayes è uno strumento multiuso che può servire a qualsiasi causa. Leminente statistico bayesiano Donald Rubin di Harvard è stato consulente per le compagnie del tabacco che devono affrontare cause legali per danni causati dal fumo.
Sono comunque affascinato dal teorema di Bayes. Mi ricorda la teoria dellevoluzione, unaltra idea che sembra tautologicamente semplice o spaventosamente profonda, a seconda di come la vedi, e che ha ispirato abbondanti assurdità e intuizioni profonde.
Forse è perché il mio cervello è bayesiano, ma ho iniziato a rilevare ovunque allusioni a Bayes. Recentemente, mentre analizzavo lopera completa di Edgar Allen Poe sul mio Kindle, mi sono imbattuto in questa frase in The Narrative of Arthur Gordon Pym of Nantucket: “In no affari di mero pregiudizio, pro o contro, deduciamo inferenze con assoluta certezza, anche dai dati più semplici. “
Tieni presente lavvertenza di Poe prima di saltare sul carro di Bayes.
* I miei amici Greg, Gary e Chris hanno scannerizzato questo post prima che io p pubblicato, quindi dovrebbero essere incolpati per eventuali errori.
Postscript: Andrew Gelman, uno statistico bayesiano alla Columbia, al cui blog mi collego sopra (nel commento su Donald Rubin), mi ha inviato questo sollecitato commento : “Lavoro sulla scienza e la politica sociale e ambientale, non sulla fisica teorica, quindi non posso davvero commentare in un modo o nellaltro luso di Bayes per sostenere le teorie delle stringhe e del multiverso! In realtà non mi piace linquadratura in cui il risultato è la probabilità che unipotesi sia vera. Funziona in alcune semplici impostazioni in cui le “ipotesi” o possibilità sono ben definite, ad esempio il controllo ortografico (vedi qui: http://andrewgelman.com/2014/01/22/spell-checking-example/). Ma non credo abbia senso pensare alla probabilità che qualche ipotesi scientifica sia vera o falsa; vedi questo documento: http://andrewgelman.com/2014/01/22/spell-checking-example/. In breve, penso che i metodi bayesiani siano un ottimo modo per inferire allinterno di un modello, ma non in generale un buon modo per valutare la probabilità che un modello o unipotesi sia vera (anzi, penso la probabilità che un modello o unipotesi è vero è generalmente unaffermazione priva di significato eccetto per quanto indicato in alcuni esempi ristretti anche se importanti). Ho anche notato questo tuo paragrafo: “In molti casi, la stima della precedente è solo unipotesi, consentendo a fattori soggettivi di insinuarsi nei tuoi calcoli. Potresti indovinare la probabilità di qualcosa che, a differenza del cancro, non esiste nemmeno, come gli archi, i multiversi, linflazione o Dio. Potresti quindi citare prove dubbie a sostegno della tua dubbia convinzione. In questo modo, il teorema di Bayes può promuovere la pseudoscienza e la superstizione oltre che la ragione. “Penso che questa citazione sia in qualche modo fuorviante in quanto tutte le parti di un modello sono congetture soggettive. Oppure, per dirla in un altro modo, tutto un modello statistico deve essere compreso e valutato. Mi oppongo allatteggiamento secondo cui il modello di dati viene assunto corretto mentre la distribuzione precedente è sospetta. Ecco qualcosa che ho scritto sullargomento: http://andrewgelman.com/2015/01/27/perhaps-merely-accident-history-skeptics-subjectivists-alike-strain-gnat-prior-distribution-swallowing-camel-likelihood/. “
Ulteriori letture:
I cervelli sono bayesiani?
Mi sbagliavo riguardo alla fine della scienza?
Una ricerca sui vecchi file mi ricorda perché sono così critico nei confronti della scienza.
Lo studio rivela unincredibile ondata di hype scientifico.