Udtrykket “falske forhold” bruges almindeligvis i statistikker og især i eksperimentelle forskningsteknikker, som begge forsøger at forstå og forudsige direkte årsagsforhold (X → Y). En ikke-kausal sammenhæng kan falsk oprettes af en fortilfælde, der forårsager begge (W → X og W → Y). Medierende variabler (X → W → Y) estimerer en total effekt snarere end direkte effekt uden justering af den medierende variabel M.
ExperimentsEdit
I eksperimenter kan falske relationer ofte identificeres ved at kontrollere for andre faktorer, herunder dem, der er teoretisk blevet identificeret som mulige forvirrende faktorer. Overvej f.eks. En forsker, der prøver at afgøre, om et nyt lægemiddel dræber bakterier; når forskeren anvender lægemidlet på en bakteriekultur, dør bakterierne. Men for at hjælpe med at udelukke tilstedeværelsen af en forvirrende variabel udsættes en anden kultur for betingelser, der er så næsten identiske som dem, der står over for den førstnævnte kultur, men den anden kultur udsættes ikke for stoffet. Hvis der er en uset sammenblandende faktor under disse betingelser, vil denne kontrolkultur også dø, så der ikke kan drages nogen konklusion om lægemidlets effektivitet ud fra resultaterne af den første kultur. På den anden side, hvis kontrolkulturen ikke dør, kan forskeren ikke afvise hypotesen om, at lægemidlet er effektivt.
Ikke-eksperimentelle statistiske analyser Rediger
Discipliner, hvis data for det meste er mest ikke-eksperimentel, såsom økonomi, anvender normalt observationsdata for at etablere årsagsforhold. Sammensætningen af statistiske teknikker, der anvendes i økonomi, kaldes økonometri. Den vigtigste statistiske metode i økonometri er multivariabel regressionsanalyse. Typisk et lineært forhold som
y = a 0 + a 1 x 1 + a 2 x 2 + ⋯ + akxk + e {\ displaystyle y = a_ {0} + a_ {1} x_ {1} + a_ {2} x_ {2} + \ cdots + a_ {k} x_ {k} + e}
er hypoteset, hvor y {\ displaystyle y} er den afhængige variabel (antages at være den forårsagede variabel), xj {\ displaystyle x_ {j}} for j = 1, …, k er den j. uafhængige variabel (antaget at være en årsagsvariabel), og e {\ displaystyle e} er fejludtrykket (der indeholder de kombinerede effekter af alle andre årsagsvariabler, som ikke skal være korreleret med de inkluderede uafhængige variabler). Hvis der er grund til at tro, at ingen af x j {\ displaystyle x_ {j}} er forårsaget af y, opnås estimater af koefficienterne a j {\ displaystyle a_ {j}}. Hvis nulhypotesen om, at aj = 0 {\ displaystyle a_ {j} = 0} afvises, så er den alternative hypotese, at aj ≠ 0 {\ displaystyle a_ {j} \ neq 0} og tilsvarende, at xj {\ displaystyle x_ {j }} forårsager, at y ikke kan afvises. På den anden side, hvis nulhypotesen om, at aj = 0 {\ displaystyle a_ {j} = 0} ikke kan afvises, kan hypotesen om ingen årsagseffekt af xj {\ displaystyle x_ {j}} ækvivalent ikke afvises . Her er begrebet kausalitet en medvirkende årsagssammenhæng: Hvis den sande værdi aj ≠ 0 {\ displaystyle a_ {j} \ neq 0}, vil en ændring i xj {\ displaystyle x_ {j}} resultere i en ændring i y medmindre en eller anden årsagsvariabel (er), enten inkluderet i regressionen eller implicit i fejludtrykket, ændres på en sådan måde, at den nøjagtigt udligner dens virkning; en ændring i x j {\ displaystyle x_ {j}} er således ikke tilstrækkelig til at ændre y. Ligeledes er en ændring i xj {\ displaystyle x_ {j}} ikke nødvendig for at ændre y, fordi en ændring i y kan være forårsaget af noget implicit i fejludtrykket (eller af en anden årsagsforklarende variabel inkluderet i modellen).
Regressionsanalyse styrer andre relevante variabler ved at inkludere dem som regressorer (forklarende variabler). Dette hjælper med at undgå fejlagtig slutning af kausalitet på grund af tilstedeværelsen af en tredje, underliggende variabel, der påvirker både den potentielt forårsagende variabel og den potentielt forårsagede variabel: dens virkning på den potentielt forårsagede variabel fanges ved direkte at inkludere den i regressionen, så denne effekt vil ikke blive afhentet som en falsk effekt af den potentielt årsagssammenhængende interesse. Derudover hjælper brugen af multivariat regression med at undgå forkert at udlede, at en indirekte effekt af f.eks. X1 (f.eks. X1 → x2 → y) er en direkte effekt (x1 → y).
Ligesom en eksperimentator skal være omhyggelig med at anvende et eksperimentelt design, der styrer for hver forvirrende faktor, så også brugeren af multipel regression skal være omhyggelig med at kontrollere for alle forvirrende faktorer ved at inkludere dem blandt regressorerne.Hvis en forvirrende faktor udelades fra regressionen, fanges dens effekt som standard i fejludtrykket, og hvis den resulterende fejlperiode er korreleret med en (eller flere) af de inkluderede regressorer, kan den estimerede regression muligvis være partisk eller inkonsekvent ( se udeladt variabel bias).
Ud over regressionsanalyse kan dataene undersøges for at afgøre, om Granger årsagssammenhæng eksisterer. Tilstedeværelsen af Granger-kausalitet indikerer både, at x går forud for y, og at x indeholder unik information om y.