Bayes의 정리 : 무엇이 큰 거래입니까?

베이 즈의 정리를 언제 처음 들었는지 잘 모르겠습니다. 하지만 저는 지난 10 년 동안이 문제에 관심을 갖기 시작했습니다. 몇몇 학생들이이 책을 인생을 항해하는 거의 마법적인 가이드로 선전 한 후였습니다.

설명과 마찬가지로 제 학생들의 폭언이 저를 혼란스럽게했습니다. 위키 백과와 다른 곳의 정리에 대해 너무 멍청하거나 너무 복잡하다고 생각했습니다. 나는 Bayes가 더 깊이 조사 할 가치가없는 지나가는 유행이라고 편리하게 결정했습니다. 그러나 이제 Bayes 열은 무시하기에는 너무 만연해졌습니다.

Bayesian 통계는 “물리학에서 암 연구, 생태학, 심리학에 이르기까지 모든 것에 파문을 일으키고 있습니다.”라고 New York Times는보고합니다. 물리학 자들은 양자 역학에 대한 베이지안 해석을 제안했습니다. 문자열과 다중 우주 이론에 대한 베이지안 방어. 철학자들은 과학 전체를 베이지안 과정으로 볼 수 있으며, 베이 즈는 칼 포퍼가 대중화 한 방법 인 위조보다 과학과 의사 과학을 더 정확하게 구분할 수 있다고 주장합니다.

Google의 자율 주행 자동차 설계자를 포함한 인공 지능 연구자들은 베이지안 소프트웨어를 사용하여 기계가 패턴을 인식하고 결정을 내리는 데 도움을줍니다. 인기있는 Bayes 정리 역사의 저자 인 Sharon Bertsch McGrayne에 따르면 베이지안 프로그램은 “스팸 분류”라고합니다. 무엇보다도 의료 및 국토 안보 위험을 평가하고 DNA를 해독합니다. ” Edge.org 웹 사이트에서 물리학 자 John Mather는 베이지안 기계가 너무 똑똑해서 인간을 “구식”으로 만들 수 있다고 걱정합니다.

인지 과학자들은 우리의 두뇌가인지하고, 고의적으로, 결정할 때 베이지안 알고리즘을 통합한다고 추측합니다. 11 월에 과학자들과 철학자들은 “Is the Brain Bayesian?”이라는 뉴욕 대학교 회의에서이 가능성을 탐구했습니다. (Bloggingheads.tv에서 회의에 대해 논의하고이 후속 게시물 “Are Brains Bayesian?”)

Zealots는 우리 중 더 많은 사람들이 의식적인 베이지안 추론을 채택한다면 (무의식적 인 베이지안 처리와는 반대로) 우리의 두뇌가 사용하는 것으로 추정 됨), 세상이 더 나은 곳이 될 것입니다. “베이 즈 정리의 직관적 인 설명”에서 AI 이론가 Eliezer Yudkowsky (Bloggingheads.tv에서 특이점에 대해 논의한 적이 있음)는 베이지안의 컬트 열성을 인정합니다.

“수학적 개념은 왜 학생들에게 이런 이상한 열정을 불러 일으키나요? 실험 방법 자체도 특별한 경우라고 주장하는 과학을 휩쓸고있는 이른바 베이지안 혁명이란 무엇입니까? Bayes 지지자들이 알고있는 비밀? 그들이 본 빛은 무엇입니까? 곧 알게 될 것입니다. 곧 당신은 우리 중 하나가 될 것입니다.” Yudkowsky는 농담입니다. 아니면 그 사람인가요?

이 모든 후플을 감안할 때 저는 Bayes의 바닥에 도달하려고 노력했습니다. 웹에서 수많은 설명 중 내가 찾은 것 특히 유용한 정보로는 Yudkowsky의 에세이, Wikipedia의 항목 및 철학자 Curtis Brown과 컴퓨터 과학자 인 Oscar Bonilla 및 Kalid Azad의 짧은 작품이 있습니다.이 게시물에서는 주로 내 이익을 위해 Bayes가 무엇인지 설명하려고합니다. 독자들은 평소와 같이 오류를 지적 할 것입니다. *

18 세기 장로교 목사 인 Thomas Bayes의 이름을 따서 명명 된 Bayes의 정리는 신념의 타당성을 계산하는 방법입니다 (가설, 주장, 명제)는 최상의 증거 (관찰, 데이터, 정보)를 기반으로합니다. 가장 멍청한 설명은 다음과 같습니다. 초기 신념과 새로운 증거 = 새롭고 개선 된 신념.

더 완전한 버전은 다음과 같습니다. 새로운 증거가 그 신념이 참된 관계 일 확률과 같으면 신념은 사실입니다. 그 증거의 s 곱하기 그 믿음이 참일 경우 증거가 참일 확률을 믿음이 참인지 여부에 관계없이 증거가 참일 확률로 나눈 값입니다. 알겠습니까?

의학 검사는 종종 공식을 입증하는 데 사용됩니다. 나이의 1 %에서 발생하는 것으로 추정되는 암 검사를 받았다고 가정 해 보겠습니다. 테스트가 100 % 신뢰할 수있는 경우 양성 테스트의 의미를 알기 위해 Bayes 정리가 필요하지 않지만 어쨌든 작동 방식을 확인하기 위해 정리를 사용하겠습니다.

P ( B | E), 데이터를 Bayes 방정식의 오른쪽에 연결합니다. 검사를 받기 전에 암에 걸릴 확률 인 P (B)는 1 % 또는 .01입니다. 따라서 양성 반응을 보일 확률 인 P (E)도 마찬가지입니다. 그것들은 각각 분자와 분모에 있기 때문에 서로 상쇄되고 P (B | E) = P (E | B) = 1로 남게됩니다. 검사가 양성이면 확실히 암에 걸렸고 그 반대입니다 그 반대입니다.

실제에서 테스트는 완전히 신뢰할 수있는 경우는 거의 없습니다. 따라서 테스트가 99 % 신뢰할 수 있다고 가정 해 보겠습니다.즉, 암에 걸린 100 명 중 99 명은 양성 반응을 보이고, 건강한 100 명 중 99 명은 음성 반응을 보입니다. 그것은 여전히 굉장한 테스트입니다. 검사 결과가 양성이면 암에 걸렸을 가능성이 얼마나됩니까?

이제 Bayes의 정리가 그 힘을 보여줍니다. 대부분의 사람들은 그 답이 99 % 또는 그에 가깝다고 생각합니다. 테스트가 얼마나 신뢰할 수 있는가? 그러나 Bayes의 정리에 따르면 정답은 50 %에 불과합니다.

분모 P (E)는 어떻습니까? 여기가 까다로워지는 곳입니다. P (E)는 암 여부에 관계없이 양성 검사를받을 확률입니다. 즉, 거짓 양성과 참 양성을 포함합니다.

거짓 양성 확률을 계산하려면 거짓 양성 비율 (1 % 또는 .01 곱하기 백분율)을 곱합니다. 암이없는 사람들의 .99. 합계는 .0099가됩니다. 예. 99 % 정확도의 훌륭하고 정확한 테스트에서 참 양성만큼 많은 오탐이 발생합니다.

계산을 완료하겠습니다. P (E)를 얻으려면 총 .0198에 대해 참 및 거짓 긍정을 추가하십시오.이 값을 .0099로 나누면 .5가됩니다. 따라서 다시 한번, 양성 반응을 보일 경우 암에 걸릴 확률 인 P (B | E)는 50 %입니다.

다시 검사를 받으면 불확실성을 크게 줄일 수 있습니다. 암에 걸린 P (B)는 이제 1 %가 아닌 50 %입니다. 두 번째 테스트도 양성이면 Bayes 정리는 암에 걸릴 확률이 이제 99 % 또는 .99라고 알려줍니다. 이 예에서 알 수 있듯이 반복하는 Bayes의 정리는 매우 정확한 정보를 산출 할 수 있습니다.

그러나 테스트의 신뢰도가 90 % (여전히 양호)이면 양성으로 테스트하더라도 실제로 암에 걸릴 확률이 높습니다. 두 번은 여전히 50 % 미만입니다. (이 블로그 게시물의 편리한 계산기로 내 계산을 확인하십시오.)

의사를 포함한 대부분의 사람들은 이러한 확률을 이해하는 데 어려움을 겪습니다. 이는 우리가 암 및 기타 질환에 대해 과다 진단 및 치료를받는 이유를 설명하는 데 도움이됩니다. 이 예는 베이지안이 옳다는 것을 시사합니다. 더 많은 사람들 (또는 적어도 더 많은 의료 소비자와 제공자)이 베이지안 추론을 채택한다면 세계는 참으로 더 나은 곳이 될 것입니다.

반면, Bayes는 정리는 상식의 코드 화일뿐입니다. Yudkowsky는 그의 튜토리얼의 끝 부분에 다음과 같이 썼습니다. “이 시점에서 Bayes”정리는 흥미롭고 새롭기보다는 뻔뻔 스럽거나 심지어 팽팽하게 보일 수 있습니다. 그렇다면이 소개는 그 목적에서 완전히 성공한 것입니다.”

암 검사 사례를 고려하십시오. Bayes의 정리는 양성 검사 결과 암에 걸릴 확률을 실제 양성 검사의 확률을 다음으로 나눈 값이라고 말합니다. 모든 양성 테스트의 확률, 거짓 및 참. 요컨대, 오 탐지에주의하십시오.

이 원칙에 대한 저의보다 일반적인 진술은 다음과 같습니다. 당신의 믿음의 타당성은 당신의 믿음 (그리고 오직 당신의 믿음)이 증거를 설명하는 정도에 달려 있습니다. 그것. 증거에 대한 대안적인 설명이 많을수록 당신의 믿음은 덜 그럴듯합니다. 이것이 저에게 Bayes 정리의 핵심입니다.

“대안 설명”은 많은 것을 포함 할 수 있습니다. 귀하의 증거는 오류가 있거나 오작동 도구, 잘못된 분석, 확인 편향, 심지어 사기로 인해 왜곡 될 수 있습니다. 귀하의 증거는 건전하지만 귀하의 것 이외의 많은 신념이나 가설로 설명 할 수 있습니다.

즉, Bayes의 정리에 대해 마술적인 것은 없습니다. 이는 귀하의 믿음이 유효하다는 사실로 귀결됩니다. 좋은 증거가 있으면 Bayes 정리가 좋은 결과를 얻을 수 있습니다. 증거가 어리 석다면 Bayes 정리는별로 쓸모가 없습니다. 쓰레기 투입, 쓰레기 배출

잠재력 Bayes 남용은 P (B)로 시작합니다. P (B)는 귀하의 믿음 가능성에 대한 초기 추정치이며 종종 “사전”이라고합니다. 위의 암 테스트 예에서 우리는 암 유병률에 대해 1 % 또는 .01의 정확하고 정확한 사전을 제공했습니다. 현실 세계에서 전문가들은 암을 진단하고 계산하는 방법에 동의하지 않습니다. 사전 예측은 단일 숫자가 아닌 다양한 확률로 구성되는 경우가 많습니다.

대부분의 경우 사전 추정은 추측에 불과하므로 주관적인 요인이 계산에 포함됩니다. 암과는 달리 문자열, 다중 우주, 인플레이션 또는 신과 같이 존재하지도 않는 무언가의 가능성을 추측 할 수 있습니다. 그런 다음 의심스러운 믿음을 뒷받침하는 의심스러운 증거를 인용 할 수 있습니다. 이런 식으로 베이 즈 정리는 사이비 과학과 미신뿐만 아니라 이성을 장려 할 수 있습니다.

베이 즈 정리에는 도덕적 인 메시지가 담겨 있습니다. 증거에 대한 대안적인 설명을 꼼꼼히 찾지 않으면 증거가 당신이 이미 믿는 것을 확인할 것입니다. 과학자들은 종종이 격언에주의를 기울이지 않아 많은 과학적 주장이 잘못된 것으로 판명되는 이유를 설명합니다. 베이지안은 그들의 방법이 과학자들이 확증 편향을 극복하고 더 신뢰할 수있는 결과를 생성하는 데 도움이 될 수 있다고 주장하지만 나는 의심이 있습니다.

그리고 위에서 언급했듯이 일부 문자열 및 다중 우주 애호가들은 베이지안 분석을 수용하고 있습니다. 왜? 애호가들은 끈과 다 우주 이론이 위조 할 수없고 따라서 비 과학적이라는 말을 듣는 것에 지 쳤기 때문에 Bayes의 정리를 통해 이론을보다 유리한 관점에서 제시 할 수 있습니다. 이 경우, 확인 편향에 대응하는 것과는 거리가 먼 Bayes의 정리가이를 가능하게합니다.

과학 작가 Faye Flam이 최근 The New York Times에 발표했듯이 베이지안 통계는 “나쁜 과학으로부터 우리를 구할 수 없습니다. ” Bayes의 정리는 모든 원인에 기여할 수있는 다목적 도구입니다. 저명한 Bayesian 통계학자인 Harvard의 Donald Rubin은 흡연으로 인한 손해 배상 소송에 직면 한 담배 회사의 컨설턴트로 일했습니다.

하지만 저는 매혹적입니다. 그것은 당신이 그것을 보는 방식에 따라 tautologically 단순하거나 위압적으로 깊어 보이며 풍부한 넌센스와 심오한 통찰력을 불러 일으킨 또 다른 아이디어 인 진화 이론을 상기시켜줍니다.

내 두뇌가 베이지안이기 때문일 수도 있지만, 모든 곳에서 Bayes에 대한 암시를 감지하기 시작했습니다. 최근에 Edgar Allen Poe의 Kindle에 대한 Complete Works를 살펴 보던 중, The Narrative of Arthur Gordon Pym of Nantucket에서이 문장을 발견했습니다. 단순한 편견의 문제, 찬반 양론, 우리는 가장 단순한 데이터에서도 완전히 확실하게 추론을 추론합니까.”

베이 즈 마차에 뛰어 들기 전에 Poe의주의 사항을 염두에 두십시오.

* 내 친구 Greg, Gary 및 Chris는 내가 전에이 게시물을 스캔했습니다. 오류에 대해 비난 받아야합니다.

Postscript : 내가 위에 링크 한 블로그 (Donald Rubin에 대한 발언에서)의 컬럼비아의 베이지안 통계학자인 Andrew Gelman이 저에게이 요청한 의견을 보냈습니다. : “저는 이론 물리학이 아닌 사회 및 환경 과학과 정책에 대해 연구하고 있습니다. 그래서 저는 끈과 다 우주 이론을 주장하기 위해 Bayes를 사용하는 것에 대해 어떤 식 으로든 언급 할 수 없습니다! 저는 사실 결과가 가설이 사실 일 확률이라는 틀이 마음에 들지 않습니다. 이는 맞춤법 검사와 같이 가설또는 가능성이 잘 정의 된 몇 가지 간단한 설정에서 작동합니다 (여기 참조 : http://andrewgelman.com/2014/01/22/spell-checking-example/). 하지만 저는 어떤 과학적 가설이 참이거나 거짓 일 확률을 생각하는 것은 말이되지 않는다고 생각합니다. 이 문서 참조 : http://andrewgelman.com/2014/01/22/spell-checking-example/. 요컨대 베이지안 방법은 모델 내에서 추론을 수행하는 좋은 방법이라고 생각하지만 일반적으로 모델이나 가설이 참일 확률을 평가하는 좋은 방법은 아닙니다 (실제로 저는 모델 또는 가설이 is true 는 중요한 예이지만 특정 좁은 범위에서 언급 된 경우를 제외하고는 일반적으로 의미가없는 진술입니다. 나는 또한 다음과 같은 단락을 발견했습니다. 대부분의 경우 사전 추정은 추측에 불과하므로 주관적인 요인이 계산에 포함됩니다. 암과는 달리 문자열, 다중 우주, 인플레이션 또는 신과 같이 존재하지도 않는 무언가의 가능성을 추측 할 수 있습니다. 그런 다음 의심스러운 믿음을 뒷받침하는 의심스러운 증거를 인용 할 수 있습니다. 이런 식으로 베이 즈의 정리는 이성뿐만 아니라 사이비 과학과 미신을 장려 할 수 있습니다.”이 인용문은 모델의 모든 부분이 주관적인 추측이라는 점에서 다소 오해의 소지가 있다고 생각합니다. 또는 다른 말로하면 모든 통계 모델을 이해하고 평가해야합니다. 나는 데이터 모델이 옳다고 가정하고 사전 분포가 의심된다는 태도에 반대합니다. 주제에 대해 제가 쓴 내용은 다음과 같습니다. http://andrewgelman.com/2015/01/27/perhaps-merely-accident-history-skeptics-subjectivists-alike-strain-gnat-prior-distribution-swallowing-camel-likelihood/.”

추가 자료 :

Brains Bayesian입니까?

내가 과학의 종말을 잘못 알고 있었나요?

오래된 파일을 살펴보면 내가 과학에 너무 비판적인 이유가 생각 나게됩니다.

연구를 통해 과학적 과대 광고에서 놀라운 급증이 나타났습니다.

답글 남기기

이메일 주소를 발행하지 않을 것입니다. 필수 항목은 *(으)로 표시합니다