스퓨리어스 관계

“스퓨리어스 관계”라는 용어는 통계, 특히 실험적 연구 기법에서 일반적으로 사용되며, 둘 다 직접적인 인과 관계를 이해하고 예측하려고 시도합니다 (X → Y). 비인 과적 상관 관계는 (W → X 및 W → Y) 모두를 유발하는 선행 요소에 의해 가짜로 생성 될 수 있습니다. 매개 변수 (X → W → Y)가 탐지되지 않으면 매개 변수 M에 대한 조정없이 직접적인 효과보다는 전체 효과를 추정합니다.이 때문에 실험적으로 확인 된 상관 관계는 가짜 관계를 배제 할 수없는 한 인과 관계를 나타내지 않습니다.

ExperimentsEdit

실험에서, 이론적으로 가능한 혼동 요인으로 식별 된 요인을 포함하여 다른 요인을 제어하여 가짜 관계를 식별 할 수 있습니다. 예를 들어, 신약이 박테리아를 죽이는 지 여부를 확인하려는 연구원을 생각해보십시오. 연구원이 약물을 박테리아 배양에 적용하면 박테리아가 죽습니다. 그러나 혼란스러운 변수의 존재를 배제하는 데 도움이되도록 다른 문화는 처음 언급 한 문화에 직면 한 문화와 거의 동일한 조건에 적용되지만 두 번째 문화는 약물에 영향을받지 않습니다. 이러한 조건에서 보이지 않는 교란 요인이있는 경우이 대조군 배양도 죽어 첫 번째 배양 결과에서 약물의 효능에 대한 결론을 도출 할 수 없습니다. 반면, 대조군 배양이 죽지 않으면 연구자는 약물이 효능이 있다는 가설을 거부 할 수 없습니다.

비 실험적 통계 분석 편집

데이터가 대부분인 분야 경제학과 같은 비실험적인 경우 일반적으로 관찰 데이터를 사용하여 인과 관계를 설정합니다. 경제학에서 사용되는 통계 기법의 몸체를 계량 경제학이라고합니다. 계량 경제학의 주요 통계 방법은 다 변수 회귀 분석입니다. 일반적으로

y = a 0 + a 1 x 1 + a 2 x 2 + ⋯ + akxk + e {\ displaystyle y = a_ {0} + a_ {1} x_ {1} + a_와 같은 선형 관계 {2} x_ {2} + \ cdots + a_ {k} x_ {k} + e}

가 가정되고, 여기서 y {\ displaystyle y}는 종속 변수 (원인 변수라고 가정), xj {\ displaystyle x_ {j}} for j = 1, …, k는 j 번째 독립 변수 (인과 변수라고 가정 함)이고 e {\ displaystyle e}는 오류 항 (모두의 결합 된 효과 포함)입니다. 포함 된 독립 변수와 상관이 없어야하는 기타 원인 변수). x j {\ displaystyle x_ {j}} 중 어느 것도 y에 의해 발생하지 않는다고 믿을만한 이유가 있으면 계수 a j {\ displaystyle a_ {j}}의 추정치를 얻습니다. aj = 0 {\ displaystyle a_ {j} = 0}이라는 귀무 가설이 기각되면 aj ≠ 0 {\ displaystyle a_ {j} \ neq 0}과 동등하게 xj {\ displaystyle x_ {j }}은 y를 거부 할 수 없도록합니다. 반면에 aj = 0 {\ displaystyle a_ {j} = 0}이라는 귀무 가설을 기각 할 수 없다면, y에 대한 xj {\ displaystyle x_ {j}}의 인과 적 효과가 없다는 가설도 기각 될 수 없습니다. . 여기서 인과 관계의 개념은 원인이되는 인과 관계 중 하나입니다. 참 값 aj ≠ 0 {\ displaystyle a_ {j} \ neq 0}이면 xj {\ displaystyle x_ {j}}가 변경되면 y가 변경됩니다. 회귀에 포함되거나 오류 항에 암시 된 일부 다른 원인 변수가 그 효과를 정확히 상쇄하는 방식으로 변경되지 않는 한; 따라서 x j {\ displaystyle x_ {j}}의 변경은 y를 변경하는 데 충분하지 않습니다. 마찬가지로 xj {\ displaystyle x_ {j}}의 변경은 y를 변경하는 데 필요하지 않습니다. y의 변경은 오류 항 (또는 모델에 포함 된 다른 원인이되는 설명 변수)에 내재 된 무언가로 인해 발생할 수 있기 때문입니다.

다른 관련 변수를 회귀 변수 (설명 변수)로 포함하여 회귀 분석을 제어합니다. 이는 잠재적 인 원인 변수와 잠재적으로 유발 된 변수 모두에 영향을주는 세 번째 기본 변수의 존재로 인한 인과 관계의 잘못된 추론을 방지하는 데 도움이됩니다. 잠재적으로 유발 된 변수에 대한 영향은 회귀에 직접 포함하여 캡처하므로 그 효과는 잠재적 인 원인이되는 관심 변수의 가짜 효과로 포착되지 않습니다. 또한 다변량 회귀를 사용하면 x1 (예 : x1 → x2 → y)의 간접 효과가 직접 효과 (x1 → y)라는 잘못된 추론을 방지 할 수 있습니다.

실험자는 모든 교란 요인을 제어하는 실험 설계를 신중하게 사용해야하므로 다중 회귀 사용자도 모든 교란 요인을 회귀 변수에 포함하여 제어하도록주의해야합니다.혼동 요인이 회귀에서 생략되면 그 효과는 기본적으로 오차 항에 캡처되고 결과 오차 항이 포함 된 회귀 자 중 하나 (또는 그 이상)와 상관 관계가있는 경우 추정 된 회귀가 편향되거나 일치하지 않을 수 있습니다 ( 생략 된 변수 편향 참조).

회귀 분석 외에도 데이터를 조사하여 Granger 인과 관계가 존재하는지 확인할 수 있습니다. Granger 인과 관계의 존재는 x가 y보다 선행하고 x가 y에 대한 고유 정보를 포함하고 있음을 나타냅니다.

답글 남기기

이메일 주소를 발행하지 않을 것입니다. 필수 항목은 *(으)로 표시합니다