Hoofdstuk 2: Correlatie: Correlatie
Inleiding tot correlatie
Correlatie
Correlatie is een statistische maat die de relatie tussen twee variabelen beschrijft.
Als twee variabelen aan elkaar gerelateerd zijn, dan betekent dit dat er een consistent patroon bestaat in hoe deze twee variabelen variëren.
Om de relatie tussen twee variabelen te bepalen hebben we voor ieder individu in de dataset twee metingen nodig, één voor elke variabele. Een dergelijk paar metingen wordt over het algemeen aangeduid als een geval.
Toepassingen van Correlatie
Het kennen van de relatie tussen variabelen is met name nuttig omdat dit ons in staat stelt om voorspellingen te doen. Als er namelijk een consistent patroon tussen twee variabelen bestaat, dan kunnen we de waarde van één van de variabelen gebruiken om een voorspelling te doen over de waarde van de andere variabele.
Kennis van de relatie tussen variabelen is wat een service zoals Netflix in staat stelt om te bepalen welke programma's je aan te raden op basis van de shows die je eerder bekeken hebt.
Er bestaat een sterke relatie tussen de lengte en het gewicht van een volwassen persoon:
- Mensen die bovengemiddeld lang zijn, wegen over het algemeen ook meer dan de gemiddelde persoon.
- Mensen die ondergemiddeld lang zijn, wegen over het algemeen ook minder dan de gemiddelde persoon.
Op basis van deze relatie, zouden we onze kennis van iemands lengte kunnen gebruiken om een voorspelling te doen over het gewicht van deze persoon, en vice versa. Bijvoorbeeld:
- Als we weten dat iemand langer dan gemiddeld is, dan kunnen we redelijkerwijs voorspellen dat deze persoon ook meer dan gemiddeld zal wegen.
- Als we weten dat iemand minder dan gemiddeld weegt, dan kunnen we redelijkerwijs voorspellen dat deze persoon ook korter dan gemiddeld zal zijn.
omptest.org als je een OMPT examen moet maken.