Bayes Satz: Was ist die große Sache?

Ich bin mir nicht sicher, wann ich zum ersten Mal von Bayes Satz gehört habe. Aber ich habe erst im letzten Jahrzehnt wirklich angefangen, darauf zu achten, nachdem einige meiner wackeligeren Schüler es als einen fast magischen Leitfaden für die Navigation durch das Leben angepriesen hatten.

Die Beschimpfungen meiner Schüler verwirrten mich ebenso wie Erklärungen des Satzes auf Wikipedia und anderswo, den ich entweder zu niedergeschlagen oder zu kompliziert fand. Ich entschied bequemerweise, dass Bayes eine Modeerscheinung war, die es nicht wert war, eingehender untersucht zu werden. Aber jetzt ist das Bayes-Fieber zu weit verbreitet, um es zu ignorieren.

Die Bayesschen Statistiken „durchziehen alles von Physik über Krebsforschung, Ökologie bis hin zur Psychologie“, berichtet die New York Times. Physiker haben Bayessche Interpretationen der Quantenmechanik vorgeschlagen und Bayessche Verteidigung von String- und Multiversum-Theorien. Philosophen behaupten, dass die Wissenschaft als Ganzes als Bayesscher Prozess angesehen werden kann und dass Bayes Wissenschaft von Pseudowissenschaft genauer unterscheiden kann als Fälschung, die von Karl Popper populäre Methode.

Forscher für künstliche Intelligenz, einschließlich der Designer von Googles selbstfahrenden Autos, setzen Bayessche Software ein, um Maschinen dabei zu helfen, Muster zu erkennen und Entscheidungen zu treffen. Laut Sharon Bertsch McGrayne, Autor einer populären Geschichte des Bayesschen Theorems, sortieren Spam Bewerten Sie anhand von E-Mails unter anderem medizinische Risiken und Sicherheitsrisiken im Heimatland und entschlüsseln Sie DNA. “ Auf der Website Edge.org befürchtet der Physiker John Mather, dass Bayessche Maschinen so intelligent sein könnten, dass sie den Menschen „obsolet“ machen.

Kognitionswissenschaftler vermuten, dass unser Gehirn Bayessche Algorithmen einbezieht, wenn sie wahrnehmen, überlegen und entscheiden. Im November untersuchten Wissenschaftler und Philosophen diese Möglichkeit auf einer Konferenz an der New York University mit dem Titel „Is the Brain Bayesian?“ (Ich diskutiere das Treffen auf Bloggingheads.tv und in diesem Folgebeitrag „Are Brains Bayesian?“)

Zeloten bestehen darauf, dass, wenn mehr von uns bewusstes Bayesianisches Denken übernehmen (im Gegensatz zur unbewussten Bayesianischen Verarbeitung) Unser Gehirn beschäftigt angeblich), die Welt wäre ein besserer Ort. In „Eine intuitive Erklärung des Bayes-Theorems“ erkennt der KI-Theoretiker Eliezer Yudkowsky (mit dem ich einmal die Singularität auf Bloggingheads.tv besprochen habe) die kultische Leidenschaft der Bayesianer an:

„Warum erzeugt ein mathematisches Konzept bei seinen Schülern diese seltsame Begeisterung? Was ist die sogenannte Bayessche Revolution, die jetzt durch die Wissenschaften zieht und behauptet, sogar die experimentelle Methode selbst als Sonderfall zu subsumieren? Was ist das? Geheimnis, das die Anhänger von Bayes kennen? Was ist das Licht, das sie gesehen haben? Bald wirst du es wissen. Bald wirst du einer von uns sein. “ Yudkowsky macht Witze. Oder doch?

Angesichts all dieser Probleme habe ich ein für alle Mal versucht, Bayes auf den Grund zu gehen. Von den unzähligen Erklärungen im Internet habe ich solche gefunden Besonders hilfreich sind Yudkowskys Aufsatz, der Wikipedia-Eintrag und kürzere Stücke des Philosophen Curtis Brown sowie der Informatiker Oscar Bonilla und Kalid Azad. In diesem Beitrag werde ich versuchen, vor allem zu meinem eigenen Vorteil zu erklären, worum es bei Bayes geht. Ich vertraue auf Freundlichkeit Die Leser werden wie üblich auf Fehler hinweisen. *

Der nach seinem Erfinder, dem presbyterianischen Minister des 18. Jahrhunderts, Thomas Bayes, benannte Satz von Bayes ist eine Methode zur Berechnung der Gültigkeit von Überzeugungen (Hypothesen, Behauptungen, Aussagen) basierend auf den besten verfügbaren Beweisen (Beobachtungen, Daten, Informationen). Hier ist die am meisten heruntergekommene Beschreibung: Anfänglicher Glaube plus neuer Beweis = neuer und verbesserter Glaube.

Hier ist eine umfassendere Version: Die Wahrscheinlichkeit, dass Ein Glaube ist wahr, wenn neue Beweise der Wahrscheinlichkeit entsprechen, dass der Glaube wahr ist s dieser Beweise multipliziert mit der Wahrscheinlichkeit, dass die Beweise wahr sind, vorausgesetzt, dass der Glaube wahr ist, geteilt durch die Wahrscheinlichkeit, dass die Beweise wahr sind, unabhängig davon, ob der Glaube wahr ist. Verstanden?

Medizinische Tests dienen oft dazu, die Formel zu demonstrieren. Nehmen wir an, Sie werden auf Krebs getestet, der bei einem Prozent der Menschen in Ihrem Alter auftritt. Wenn der Test zu 100 Prozent zuverlässig ist, brauchen Sie den Bayes-Satz nicht, um zu wissen, was ein positiver Test bedeutet, aber lassen Sie uns den Satz trotzdem verwenden, um zu sehen, wie er funktioniert.

Um nach P (zu lösen) B | E) stecken Sie die Daten in die rechte Seite der Bayes-Gleichung. P (B), die Wahrscheinlichkeit, dass Sie vor dem Test Krebs haben, beträgt ein Prozent oder 0,01. So ist P (E), die Wahrscheinlichkeit, dass Sie positiv testen. Da sie sich im Zähler bzw. Nenner befinden, heben sie sich gegenseitig auf und Sie haben P (B | E) = P (E | B) = 1. Wenn Sie positiv testen, haben Sie definitiv Krebs und Laster umgekehrt.

In der realen Welt sind Tests selten oder nie absolut zuverlässig. Nehmen wir also an, Ihr Test ist zu 99 Prozent zuverlässig.Das heißt, 99 von 100 krebskranken Menschen werden positiv und 99 von 100 gesunden Menschen negativ getestet. Das ist immer noch ein großartiger Test. Wenn Ihr Test positiv ist, wie wahrscheinlich ist es, dass Sie Krebs haben?

Nun zeigt der Satz von Bayes seine Kraft. Die meisten Menschen gehen davon aus, dass die Antwort zu 99 Prozent oder in der Nähe liegt. So zuverlässig ist der Test, oder? Die richtige Antwort nach dem Bayes-Theorem lautet jedoch nur 50 Prozent.

Was ist mit dem Nenner P (E)? Hier wird es schwierig. P (E) ist die Wahrscheinlichkeit, positiv zu testen, ob Sie Krebs haben oder nicht. Mit anderen Worten, es enthält sowohl falsch positive als auch wahr positive Ergebnisse.

Um die Wahrscheinlichkeit eines falsch positiven Ergebnisses zu berechnen, multiplizieren Sie die Rate falsch positiver Ergebnisse mit einem Prozent oder 0,01-fachen des Prozentsatzes von Menschen, die keinen Krebs haben, .99. Die Summe ergibt 0,0099. Ja, Ihr hervorragender, zu 99 Prozent genauer Test liefert so viele falsch positive wie wahr positive Ergebnisse.

Beenden wir die Berechnung. Um P (E) zu erhalten, addieren Sie wahre und falsche Positive für insgesamt .0198, was bei Division in .0099 zu .5 führt. Also noch einmal, P (B | E), die Wahrscheinlichkeit, dass Sie Krebs haben, wenn Sie positiv testen, beträgt 50 Prozent.

Wenn Sie erneut getestet werden, können Sie Ihre Unsicherheit enorm reduzieren, weil Ihre Wahrscheinlichkeit von Krebs (P (B)) liegt jetzt bei 50 Prozent und nicht mehr bei einem Prozent. Wenn Ihr zweiter Test ebenfalls positiv ausfällt, sagt Ihnen das Bayes-Theorem, dass Ihre Wahrscheinlichkeit, an Krebs zu erkranken, jetzt 99 Prozent oder 0,99 beträgt. Wie dieses Beispiel zeigt, kann die Iteration des Bayes-Theorems äußerst genaue Informationen liefern.

Wenn die Zuverlässigkeit Ihres Tests jedoch 90 Prozent beträgt, was immer noch ziemlich gut ist, sind Ihre Chancen, tatsächlich an Krebs zu erkranken, selbst wenn Sie positiv testen zweimal sind immer noch weniger als 50 Prozent. (Überprüfen Sie meine Mathematik mit dem praktischen Taschenrechner in diesem Blog-Beitrag.)

Die meisten Menschen, einschließlich Ärzte, haben Schwierigkeiten, diese Chancen zu verstehen. Dies erklärt, warum wir wegen Krebs und anderen Erkrankungen überdiagnostiziert und überbehandelt werden. Dieses Beispiel legt nahe, dass die Bayesianer Recht haben: Die Welt wäre in der Tat ein besserer Ort, wenn mehr Menschen – oder zumindest mehr Verbraucher und Anbieter im Gesundheitswesen – die Bayessche Argumentation übernehmen würden.

Andererseits Bayes Der Satz ist nur eine Kodifizierung des gesunden Menschenverstandes. Wie Yudkowsky gegen Ende seines Tutorials schreibt: „Zu diesem Zeitpunkt Bayes“ scheint der Satz offensichtlich oder sogar tautologisch zu sein, anstatt aufregend und neu. Wenn ja, hat diese Einführung ihren Zweck vollständig erfüllt. “

Betrachten Sie den Fall von Krebstests: Der Satz von Bayes besagt, dass Ihre Wahrscheinlichkeit, an Krebs zu erkranken, wenn Sie positiv testen, die Wahrscheinlichkeit eines echten positiven Tests geteilt durch ist die Wahrscheinlichkeit aller positiven Tests, falsch und wahr. Kurz gesagt, hüten Sie sich vor Fehlalarmen.

Hier ist meine allgemeinere Aussage zu diesem Prinzip: Die Plausibilität Ihres Glaubens hängt davon ab, inwieweit Ihr Glaube – und nur Ihr Glaube – die Beweise dafür erklärt es. Je mehr alternative Erklärungen es für die Beweise gibt, desto weniger plausibel ist Ihre Überzeugung. Das ist für mich die Essenz des Bayes-Theorems.

„Alternative Erklärungen“ können viele Dinge umfassen. Ihre Beweise können fehlerhaft sein, durch ein fehlerhaftes Instrument, fehlerhafte Analyse, Bestätigungsverzerrung oder sogar Betrug verzerrt sein. Ihre Beweise mögen stichhaltig sein, aber durch viele andere Überzeugungen oder Hypothesen als Ihre erklärbar sein.

Mit anderen Worten, der Satz von Bayes ist nicht magisch. Es läuft auf die Binsenweisheit hinaus, dass Ihre Überzeugung nur so gültig ist Wenn Sie gute Beweise haben, kann der Satz von Bayes gute Ergebnisse liefern. Wenn Ihre Beweise schwach sind, wird der Satz von Bayes nicht viel nützen. Müll rein, Müll raus.

Das Potenzial Der Missbrauch von Bayes beginnt mit P (B), Ihrer anfänglichen Schätzung der Wahrscheinlichkeit Ihres Glaubens, die oft als „Prior“ bezeichnet wird. Im obigen Beispiel für einen Krebstest erhielten wir einen schönen, präzisen Prior von einem Prozent oder 0,01 für die Prävalenz von Krebs. In der realen Welt sind sich Experten nicht einig darüber, wie Krebs diagnostiziert und gezählt werden soll. Ihr Prior besteht häufig aus einer Reihe von Wahrscheinlichkeiten und nicht aus einer einzelnen Zahl.

In vielen Fällen ist die Schätzung des Prior nur eine Vermutung, sodass sich subjektive Faktoren in Ihre Berechnungen einschleichen können. Sie könnten die Wahrscheinlichkeit von etwas erraten, das – anders als Krebs – nicht einmal existiert, wie Strings, Multiversen, Inflation oder Gott. Sie könnten dann zweifelhafte Beweise anführen, um Ihren zweifelhaften Glauben zu stützen. Auf diese Weise kann der Satz von Bayes sowohl die Pseudowissenschaft und den Aberglauben als auch die Vernunft fördern.

In den Satz von Bayes ist eine moralische Botschaft eingebettet: Wenn Sie nicht gewissenhaft nach alternativen Erklärungen für Ihre Beweise suchen, die Beweise wird nur bestätigen, was Sie bereits glauben. Wissenschaftler beachten dieses Diktum oft nicht, was erklärt, warum sich so viele wissenschaftliche Behauptungen als falsch herausstellen. Bayesianer behaupten, dass ihre Methoden Wissenschaftlern helfen können, Bestätigungsverzerrungen zu überwinden und zuverlässigere Ergebnisse zu erzielen, aber ich habe meine Zweifel.

Und wie ich oben erwähnt habe, befürworten einige String- und Multiversum-Enthusiasten die Bayessche Analyse. Warum? Weil die Enthusiasten es satt haben zu hören, dass String- und Multiversum-Theorien nicht fälschbar und daher unwissenschaftlich sind, und der Satz von Bayes es ihnen ermöglicht, die Theorien in einem günstigeren Licht darzustellen. In diesem Fall ermöglicht der Satz von Bayes, weit davon entfernt, Bestätigungsvoreingenommenheit entgegenzuwirken, dies.

Wie die Wissenschaftsjournalistin Faye Flam kürzlich in der New York Times formulierte, können uns die Bayesschen Statistiken „nicht vor schlechter Wissenschaft retten. ” Der Satz von Bayes ist ein Allzweckinstrument, das jeder Sache dienen kann. Der bekannte Bayesianische Statistiker Donald Rubin aus Harvard hat als Berater für Tabakunternehmen gedient, die wegen Schadensersatzes durch Rauchen angeklagt sind.

Ich bin dennoch fasziniert Es erinnert mich an die Evolutionstheorie, eine andere Idee, die je nach Sichtweise tautologisch einfach oder entmutigend tief erscheint und die zu reichlich Unsinn und tiefgreifenden Einsichten geführt hat.

Vielleicht liegt es daran, dass mein Gehirn Bayesianisch ist, aber ich habe überall Anspielungen auf Bayes entdeckt. Als ich kürzlich Edgar Allen Poes Gesamtwerk auf meinem Kindle durchgesehen habe, bin ich in der Erzählung von Arthur Gordon Pym von Nantucket auf diesen Satz gestoßen: „In no Angelegenheiten von bloßen Vorurteilen, ob für oder gegen, leiten wir Schlussfolgerungen mit absoluter Sicherheit ab, selbst aus den einfachsten Daten. “

Beachten Sie Poes Vorbehalt, bevor Sie auf den Bayes-Wagen springen.

* Meine Freunde Greg, Gary und Chris haben diesen Beitrag gescannt, bevor ich p Es wurde veröffentlicht, daher sollten sie für etwaige Fehler verantwortlich gemacht werden.

Nachtrag: Andrew Gelman, ein Bayesianischer Statistiker in Columbia, auf dessen Blog ich oben verlinke (in der Bemerkung zu Donald Rubin), hat mir diesen erbetenen Kommentar geschickt : „Ich arbeite in den Bereichen Sozial- und Umweltwissenschaften und -politik, nicht in der theoretischen Physik, daher kann ich die Verwendung von Bayes zur Argumentation für String- und Multiversum-Theorien auf die eine oder andere Weise nicht wirklich kommentieren!“ Ich mag den Rahmen, in dem das Ergebnis die Wahrscheinlichkeit ist, dass eine Hypothese wahr ist, nicht. Dies funktioniert in einigen einfachen Einstellungen, in denen die „Hypothesen“ oder Möglichkeiten genau definiert sind, z. B. die Rechtschreibprüfung (siehe hier: http://andrewgelman.com/2014/01/22/spell-checking-example/). Ich halte es jedoch nicht für sinnvoll, an die Wahrscheinlichkeit zu denken, dass eine wissenschaftliche Hypothese wahr oder falsch ist. Siehe dieses Dokument: http://andrewgelman.com/2014/01/22/spell-checking-example/. Kurz gesagt, ich denke, Bayessche Methoden sind eine großartige Möglichkeit, innerhalb eines Modells zu schließen, aber im Allgemeinen keine gute Möglichkeit, die Wahrscheinlichkeit zu bewerten, dass ein Modell oder eine Hypothese wahr ist (in der Tat denke ich, die Wahrscheinlichkeit, dass ein Modell oder eine Hypothese vorliegt ist wahr ist im Allgemeinen eine bedeutungslose Aussage, außer wie in bestimmten engen, wenn auch wichtigen Beispielen angegeben). Ich habe auch Ihren Absatz bemerkt: „In vielen Fällen ist das Schätzen des Prior nur eine Vermutung, sodass sich subjektive Faktoren in Ihre Berechnungen einschleichen können. Sie könnten die Wahrscheinlichkeit von etwas erraten, das – anders als Krebs – nicht einmal existiert, wie Strings, Multiversen, Inflation oder Gott. Sie könnten dann zweifelhafte Beweise anführen, um Ihren zweifelhaften Glauben zu stützen. Auf diese Weise kann der Satz von Bayes sowohl Pseudowissenschaften und Aberglauben als auch Vernunft fördern. “Ich denke, dieses Zitat ist insofern etwas irreführend, als alle Teile eines Modells subjektive Vermutungen sind. Oder anders ausgedrückt, das gesamte statistische Modell muss verstanden und bewertet werden. Ich lehne die Einstellung ab, dass das Datenmodell als korrekt angenommen wird, während die vorherige Verteilung verdächtig ist. Folgendes habe ich zu diesem Thema geschrieben: http://andrewgelman.com/2015/01/27/perhaps-merely-accident-history-skeptics-subjectivists-alike-strain-gnat-prior-distribution-swallowing-camel-likelihood/.

Weiterführende Literatur:

Sind Gehirne Bayesianer?

Habe ich mich in Bezug auf das Ende der Wissenschaft geirrt?

Ein Durchstöbern alter Akten erinnert mich daran, warum ich so kritisch gegenüber der Wissenschaft bin.

Studie zeigt erstaunlichen Anstieg des wissenschaftlichen Hype. P. >

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.