De term “onechte relatie” wordt vaak gebruikt in de statistiek en in het bijzonder in experimentele onderzoekstechnieken, die beide proberen directe causale relaties te begrijpen en te voorspellen (X → Y). Een niet-causale correlatie kan ten onrechte worden gecreëerd door een antecedent dat beide veroorzaakt (W → X en W → Y). Mediërende variabelen, (X → W → Y), schatten, indien niet gedetecteerd, een totaal effect in plaats van een direct effect zonder correctie voor de mediërende variabele M.Daarom vertegenwoordigen experimenteel geïdentificeerde correlaties geen causale verbanden tenzij onechte verbanden kunnen worden uitgesloten.
ExperimentsEdit
In experimenten kunnen onechte relaties vaak worden geïdentificeerd door te controleren op andere factoren, inclusief degene die theoretisch zijn geïdentificeerd als mogelijke verstorende factoren. Neem bijvoorbeeld een onderzoeker die probeert vast te stellen of een nieuw medicijn bacteriën doodt; wanneer de onderzoeker het medicijn op een bacteriecultuur aanbrengt, sterven de bacteriën. Maar om de aanwezigheid van een verstorende variabele te helpen uitsluiten, wordt een andere cultuur onderworpen aan omstandigheden die zo goed mogelijk identiek zijn aan die waarmee de eerstgenoemde cultuur wordt geconfronteerd, maar de tweede cultuur wordt niet onderworpen aan het medicijn. Als er in die omstandigheden een onzichtbare verstorende factor is, zal deze controlecultuur ook afsterven, zodat geen conclusie kan worden getrokken over de werkzaamheid van het medicijn uit de resultaten van de eerste cultuur. Aan de andere kant, als de controlecultuur niet sterft, kan de onderzoeker de hypothese dat het medicijn werkzaam is niet verwerpen.
Niet-experimentele statistische analyses Bewerken
Disciplines waarvan de gegevens meestal zijn niet-experimenteel, zoals economie, gebruiken meestal observationele gegevens om oorzakelijke verbanden vast te stellen. De verzameling statistische technieken die in de economie worden gebruikt, wordt econometrie genoemd. De belangrijkste statistische methode in de econometrie is multivariabele regressieanalyse. Meestal een lineaire relatie, zoals
y = a 0 + a 1 x 1 + a 2 x 2 + ⋯ + akxk + e {\ displaystyle y = a_ {0} + a_ {1} x_ {1} + a_ {2} x_ {2} + \ cdots + a_ {k} x_ {k} + e}
wordt verondersteld, waarin y {\ displaystyle y} de afhankelijke variabele is (verondersteld de veroorzaakte variabele te zijn), xj {\ displaystyle x_ {j}} voor j = 1, …, k is de j-de onafhankelijke variabele (verondersteld een oorzakelijke variabele te zijn), en e {\ displaystyle e} is de foutterm (met de gecombineerde effecten van alle andere oorzakelijke variabelen, die niet gecorreleerd mogen zijn met de opgenomen onafhankelijke variabelen). Als er reden is om aan te nemen dat geen van de x j {\ displaystyle x_ {j}} s wordt veroorzaakt door y, dan worden schattingen van de coëfficiënten a j {\ displaystyle a_ {j}} verkregen. Als de nulhypothese dat aj = 0 {\ displaystyle a_ {j} = 0} wordt verworpen, dan is de alternatieve hypothese dat aj ≠ 0 {\ displaystyle a_ {j} \ neq 0} en equivalent dat xj {\ displaystyle x_ {j }} oorzaken y kunnen niet worden afgewezen. Aan de andere kant, als de nulhypothese dat aj = 0 {\ displaystyle a_ {j} = 0} niet kan worden verworpen, dan kan equivalent de hypothese dat xj {\ displaystyle x_ {j}} op y niet wordt verworpen. . Hier is het begrip causaliteit er een van bijdragende causaliteit: als de werkelijke waarde aj ≠ 0 {\ displaystyle a_ {j} \ neq 0}, dan zal een verandering in xj {\ displaystyle x_ {j}} resulteren in een verandering in y tenzij een of meer andere oorzakelijke variabele (n), ofwel opgenomen in de regressie of impliciet in de foutterm, zodanig veranderen dat het effect ervan exact wordt gecompenseerd; dus een verandering in x j {\ displaystyle x_ {j}} is niet voldoende om y te veranderen. Evenzo is een verandering in xj {\ displaystyle x_ {j}} niet nodig om y te veranderen, omdat een verandering in y veroorzaakt kan worden door iets impliciet in de foutterm (of door een andere causatieve verklarende variabele die in het model is opgenomen).
Regressieanalyse controleert andere relevante variabelen door ze op te nemen als regressoren (verklarende variabelen). Dit helpt om een verkeerde gevolgtrekking van causaliteit te voorkomen door de aanwezigheid van een derde, onderliggende variabele die zowel de potentieel causatieve variabele als de potentieel veroorzaakte variabele beïnvloedt: het effect ervan op de potentieel veroorzaakte variabele wordt opgevangen door deze direct in de regressie op te nemen. dat effect zal niet worden opgemerkt als een onecht effect van de potentieel causatieve variabele van belang. Bovendien helpt het gebruik van multivariate regressie om ten onrechte te concluderen dat een indirect effect van bijvoorbeeld x1 (bijv. X1 → x2 → y) een direct effect is (x1 → y).
Net als een experimentator moet voorzichtig zijn om een experimenteel ontwerp te gebruiken dat controleert op elke verstorende factor, dus ook moet de gebruiker van meervoudige regressie voorzichtig zijn om alle verstorende factoren te controleren door ze op te nemen onder de regressoren.Als een verstorende factor wordt weggelaten uit de regressie, wordt het effect ervan standaard vastgelegd in de foutterm, en als de resulterende foutterm gecorreleerd is met een (of meer) van de opgenomen regressoren, kan de geschatte regressie vertekend of inconsistent zijn ( zie weggelaten variabele bias).
Naast regressieanalyse kunnen de gegevens worden onderzocht om te bepalen of er een Granger-causaliteit bestaat. De aanwezigheid van Granger causaliteit geeft aan dat x voorafgaat aan y, en dat x unieke informatie over y bevat.