Rasende forhold

Begrepet «falske forhold» brukes ofte i statistikk og spesielt i eksperimentelle forskningsteknikker, som begge prøver å forstå og forutsi direkte årsaksforhold (X → Y). En ikke-kausal korrelasjon kan falskt opprettes av en antecedent som forårsaker begge (W → X og W → Y). Medierende variabler, (X → W → Y), hvis ikke oppdaget, estimerer en total effekt i stedet for direkte effekt uten justering for den medierende variabelen M. På grunn av dette representerer eksperimentelt identifiserte sammenhenger ikke årsakssammenhenger med mindre falske forhold kan utelukkes.

ExperimentsEdit

I eksperimenter kan falske forhold ofte identifiseres ved å kontrollere for andre faktorer, inkludert de som har blitt teoretisk identifisert som mulige forvirrende faktorer. Tenk for eksempel på en forsker som prøver å avgjøre om et nytt legemiddel dreper bakterier; når forskeren bruker stoffet i en bakteriekultur, dør bakteriene. Men for å hjelpe til med å utelukke tilstedeværelsen av en forvirrende variabel, utsettes en annen kultur for forhold som er nesten identiske med dem som står ovenfor den førstnevnte kulturen, men den andre kulturen er ikke utsatt for stoffet. Hvis det er en usett forvirrende faktor under disse forholdene, vil denne kontrollkulturen også dø, slik at ingen konklusjon om effektiviteten av stoffet kan trekkes fra resultatene av den første kulturen. På den annen side, hvis kontrollkulturen ikke dør, kan ikke forskeren avvise hypotesen om at stoffet er effektivt.

Ikke-eksperimentelle statistiske analyser Rediger

Disipliner hvis data hovedsakelig er hovedsakelig ikke-eksperimentell, som økonomi, bruker vanligvis observasjonsdata for å etablere årsakssammenhenger. Kroppen av statistiske teknikker som brukes i økonomi kalles økonometri. Den viktigste statistiske metoden i økonometri er multivariabel regresjonsanalyse. Vanligvis et lineært forhold som

y = a 0 + a 1 x 1 + a 2 x 2 + ⋯ + akxk + e {\ displaystyle y = a_ {0} + a_ {1} x_ {1} + a_ {2} x_ {2} + \ cdots + a_ {k} x_ {k} + e}

er hypoteset, der y {\ displaystyle y} er den avhengige variabelen (antatt å være den forårsakede variabelen), xj {\ displaystyle x_ {j}} for j = 1, …, k er den j. uavhengige variabelen (antatt å være en årsaksvariabel), og e {\ displaystyle e} er feiluttrykket (som inneholder de kombinerte effektene av alle andre årsaksvariabler, som må være ukorrelert med de inkluderte uavhengige variablene). Hvis det er grunn til å tro at ingen av x j {\ displaystyle x_ {j}} er forårsaket av y, oppnås estimater av koeffisientene a j {\ displaystyle a_ {j}}. Hvis nullhypotesen om at aj = 0 {\ displaystyle a_ {j} = 0} blir avvist, blir den alternative hypotesen om at aj ≠ 0 {\ displaystyle a_ {j} \ neq 0} og tilsvarende som xj {\ displaystyle x_ {j }} forårsaker at y ikke kan avvises. På den annen side, hvis nullhypotesen om at aj = 0 {\ displaystyle a_ {j} = 0} ikke kan avvises, kan hypotesen om ingen årsakseffekt av xj {\ displaystyle x_ {j}} ekvivalent ikke avvises . Her er begrepet kausalitet en medvirkende årsakssammenheng: Hvis den sanne verdien aj ≠ 0 {\ displaystyle a_ {j} \ neq 0}, vil en endring i xj {\ displaystyle x_ {j}} resultere i en endring i y med mindre noen andre årsaksvariabler, enten inkludert i regresjonen eller implisitt i feiluttrykket, endres på en slik måte at de nøyaktig kompenserer for effekten; dermed er ikke en endring i x j {\ displaystyle x_ {j}} tilstrekkelig til å endre y. På samme måte er en endring i xj {\ displaystyle x_ {j}} ikke nødvendig for å endre y, fordi en endring i y kan være forårsaket av noe implisitt i feiluttrykket (eller av en annen årsaksforklarende variabel som er inkludert i modellen).

Regresjonsanalyse kontrollerer andre relevante variabler ved å inkludere dem som regressorer (forklarende variabler). Dette hjelper til med å unngå feilaktig slutning av årsakssammenheng på grunn av tilstedeværelsen av en tredje, underliggende variabel som påvirker både den potensielt forårsakende variabelen og den potensielt forårsaket variabelen: dens effekt på den potensielt forårsaket variabelen blir fanget opp ved å inkludere den direkte i regresjonen, den effekten vil ikke bli plukket opp som en falsk effekt av den potensielt forårsakende variabelen av interesse. I tillegg hjelper bruken av multivariat regresjon med å unngå feilaktig å utlede at en indirekte effekt av, si x1 (f.eks. X1 → x2 → y) er en direkte effekt (x1 → y).

Akkurat som en eksperimentator må være forsiktig med å bruke en eksperimentell design som kontrollerer for hver forvirrende faktor, så også må brukeren av flere regresjoner være forsiktig med å kontrollere for alle forvirrende faktorer ved å inkludere dem blant regressorene.Hvis en forvirrende faktor utelates fra regresjonen, blir effekten som standard fanget i feiltermen, og hvis den resulterende feilperioden er korrelert med en (eller flere) av de inkluderte regressorene, kan den estimerte regresjonen være partisk eller inkonsekvent ( se utelatt variabel bias).

I tillegg til regresjonsanalyse kan dataene undersøkes for å avgjøre om Granger årsakssammenheng eksisterer. Tilstedeværelsen av Granger-kausalitet indikerer både at x går foran y, og at x inneholder unik informasjon om y.

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *