Hoofdstuk 11: Eenvoudige lineaire regressie: Eenvoudige lineaire regressie
Regressie-Analyse en Causaliteit
In het ijscowagen voorbeeld aan het begin van dit hoofdstuk, is het duidelijk dat hoe heter de dag is, hoe meer ijs er wordt verkocht. In dit geval veroorzaakt het warmere weer meer ijs te worden verkocht.
In het algemeen, moet je echter heel voorzichtig zijn om een dergelijke verklaring van causaliteit te maken. Aan de hand van een regressie-analyse, kun je nooit bewijzen dat een oorzakelijk-verband relatie bestaat tussen twee variabelen.
Een ding om in gedachten te houden bij het interpreteren van de resultaten van een regressie-analyse is het mogelijke bestaan van een loerende variabele.
#\phantom{0}#
Loerende Variable
Een loerende of verstorende variabele is een (verborgen) derde variabele die zowel het de uitkomst- en de voorspellingsvariabele beïnvloedt, waardoor de illusie ontstaat dat de uitkomst- en voorspellingsvariabele direct met elkaar te maken hebben.
Een dergelijke illusoire relatie tussen twee variabelen wordt ook wel een schijnverband genoemd.
Zo is het mogelijk om het bedrag van de schade door een brand te voorspellen op basis van het aantal brandweerlieden die worden gestuurd om het te blussen. Dit betekent zeker niet, echter, dat de brandweer de oorzaak is van de schade.
Om dit punt te illustreren, overweeg dan de volgende twee uitspraken:
- Hoe groter het vuur, hoe meer schade het heeft veroorzaakt.
- Hoe groter het vuur, hoe meer brandweerlieden gestuurd worden om het te blussen.
Hier fungeert de omvang van het vuur als een verstorende variabele die beïnvloedt zowel hoeveel schade door het vuur is aangebracht en het aantal brandweerlieden die gestuurd worden om te blussen, waarbij een schijnverband tussen de twee variabelen wordt gecreëerd.
omptest.org als je een OMPT examen moet maken.