Falešný vztah

Termín „falešný vztah“ se běžně používá ve statistikách, zejména v technikách experimentálního výzkumu, které se pokoušejí pochopit a předpovědět přímé kauzální vztahy (X → Y). Nekauzální korelaci lze falešně vytvořit předchůdcem, který způsobí obojí (W → X i W → Y). Zprostředkující proměnné (X → W → Y), pokud nejsou detekovány, odhadnou spíše celkový účinek než přímý účinek bez úpravy zprostředkující proměnné M. Z tohoto důvodu experimentálně identifikované korelace nepředstavují kauzální vztahy, pokud nelze vyloučit falešné vztahy.

ExperimentEdit

V experimentech lze falešné vztahy často identifikovat kontrolou dalších faktorů, včetně těch, které byly teoreticky identifikovány jako možné matoucí faktory. Zvažte například výzkumníka, který se snaží zjistit, zda nový lék ničí bakterie; když výzkumník aplikuje lék na bakteriální kulturu, bakterie zemřou. Aby se ale vyloučila přítomnost matoucí proměnné, je další kultura vystavena podmínkám, které jsou co nejblíže podmínkám, které čelí první zmíněné kultuře, ale druhá kultura není vystavena působení drogy. Pokud v těchto podmínkách existuje neviditelný matoucí faktor, zemře také tato kontrolní kultura, takže z výsledků první kultivace nelze vyvodit žádný závěr o účinnosti léčiva. Na druhou stranu, pokud kontrolní kultura nezemře, pak výzkumník nemůže odmítnout hypotézu, že droga je účinná.

Neexperimentální statistické analýzy Upravit

Disciplíny, jejichž data jsou většinou neexperimentální, jako je ekonomie, obvykle používají pozorovací údaje k navázání kauzálních vztahů. Tělo statistických technik používaných v ekonomii se nazývá ekonometrie. Hlavní statistickou metodou v ekonometrii je vícerozměrná regresní analýza. Typicky lineární vztah, jako je

y = a 0 + a 1 x 1 + a 2 x 2 + ⋯ + akxk + e {\ displaystyle y = a_ {0} + a_ {1} x_ {1} + a_ {2} x_ {2} + \ cdots + a_ {k} x_ {k} + e}

má hypotézu, ve které y {\ displaystyle y} je závislá proměnná (předpokládá se, že je způsobenou proměnnou), xj {\ displaystyle x_ {j}} pro j = 1, …, k je jthá nezávislá proměnná (předpokládá se, že jde o kauzativní proměnnou), a e {\ displaystyle e} je chybový člen (obsahující kombinované účinky všech další kauzální proměnné, které musí být v korelaci se zahrnutými nezávislými proměnnými). Pokud existuje důvod se domnívat, že žádný z x j {\ displaystyle x_ {j}} s není způsoben y, jsou získány odhady koeficientů a j {\ displaystyle a_ {j}}. Pokud je nulová hypotéza, že aj = 0 {\ displaystyle a_ {j} = 0} odmítnuta, pak alternativní hypotéza, že i = 0 {\ displaystyle a_ {j} \ neq 0} a ekvivalentně xj {\ displaystyle x_ {j }} příčiny y nelze odmítnout. Na druhou stranu, pokud nelze odmítnout nulovou hypotézu, že nelze odmítnout aj = 0 {\ displaystyle a_ {j} = 0}, nelze ekvivalentně odmítnout hypotézu neexistence kauzálního účinku xj {\ displaystyle x_ {j}} . Zde je pojem kauzality jedním z kauzality přispívající: Pokud je skutečná hodnota i ≠ 0 {\ displaystyle a_ {j} \ neq 0}, pak změna xj {\ displaystyle x_ {j}} bude mít za následek změnu y ledaže by se nějaká jiná příčinná proměnná (proměnné), ať už zahrnutá do regrese nebo implicitní v chybném členu, nezměnila takovým způsobem, aby přesně kompenzovala její účinek; změna x j {\ displaystyle x_ {j}} tedy nestačí ke změně y. Stejně tak změna yj {\ displaystyle x_ {j}} není nutná ke změně y, protože změna y může být způsobena něčím implicitním v chybovém výrazu (nebo nějakou jinou kauzativní vysvětlující proměnnou obsaženou v modelu).

Ovládací prvky regresní analýzy pro další relevantní proměnné tak, že je zahrnete jako regresory (vysvětlující proměnné). To pomáhá vyhnout se chybnému závěru kauzality v důsledku přítomnosti třetí základní proměnné, která ovlivňuje jak potenciálně příčinnou proměnnou, tak potenciálně způsobenou proměnnou: její účinek na potenciálně způsobenou proměnnou je zachycen přímým zahrnutím do regrese, takže tento účinek nebude zachycen jako rušivý účinek potenciálně příčinné proměnné zájmu. Kromě toho použití vícerozměrné regrese pomáhá zabránit nesprávnému odvození toho, že nepřímý účinek, řekněme x1 (např. X1 → x2 → y), je přímým účinkem (x1 → y).

Stejně jako experimentátor musí být opatrný, aby použil experimentální design, který řídí každý matoucí faktor, takže uživatel vícenásobné regrese musí být opatrný, aby ovládal všechny matoucí faktory jejich zahrnutím mezi regresory.Pokud je z regrese vynechán matoucí faktor, je jeho účinek ve výchozím nastavení zachycen v chybovém termínu a pokud výsledný chybový termín koreluje s jedním (nebo více) zahrnutými regresory, může být odhadovaná regrese zkreslená nebo nekonzistentní ( viz vynechané předpětí proměnných).

Kromě regresní analýzy lze data zkoumat a určit, zda existuje Grangerova příčinná souvislost. Přítomnost Grangerovy kauzality naznačuje, že x předchází y, a že x obsahuje jedinečné informace o y.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *