Hoofdstuk 6: Schatten en betrouwbaarheidsintervallen: Schatten
Parameter Schatting
Statistische inferentie is het proces van het maken van uitspraken over een populatie op basis van steekproefgegevens. Er zijn twee belangrijke methoden van statistische inferentie:
- Parameter schatting
- Hypothese testen
In dit deel zal het concept van de parameterschatting worden geïntroduceerd.
#\phantom{0}#
Parameter Schatting
Parameterschatting is het proces van het gebruiken van steekproefgegevens om de parameters van de populatie te schatten.
#\phantom{0}#
Er zijn twee soorten parameterschattingen: puntschattingen en betrouwbaarheidsintervallen.
#\phantom{0}#
Puntschatting
Een puntschatting is een enkele waarde die de beste gok is voor de populatie parameter.
Een nadeel van een puntschatting is dat het geen inzicht geeft in de nauwkeurigheid van de schatting.
Steekproefstatistieken als Puntschattingen
Voorbeelden van puntschattingen zijn:
- Een steekproefgemiddelde #\bar{X}# gebruiken als een schatting van het populatiegemiddelde #\mu#.
- Een steekproefproportie #\hat{p}# gebruiken als een schatting van een populatieproportie #\pi#.
#\phantom{0}#
Als je een zekere mate van precisie in je schatting wilt, bereken je een betrouwbaarheidsinterval.
#\phantom{0}#
Betrouwbaarheidsinterval
Een betrouwbaarheidsinterval #(CI)# voor een populatieparameter is een reeks waarden, gebaseerd op steekproefgegevens, die zeer aannemelijke kandidaten zijn voor de werkelijke waarde van die populatieparameter.
Betrouwbaarheidsintervallen zijn altijd vergezeld door een overeenkomstig betrouwbaarheidsniveau. Het betrouwbaarheidsniveau is de kans dat een willekeurig betrouwbaarheidsinterval de werkelijke parameter zal bevatten.
Vanuit een praktisch oogpunt, identificeert het betrouwbaarheidsniveau het deel van de tijd, met herhaalde steekproeven, dat de vastgestelde betrouwbaarheidsintervallen de werkelijke waarde van de populatieparameter bevat.
Stel, je krijgt een #95\%# #CI# voor een populatieparameter die werd berekend met behulp van een specifieke procedure op basis van steekproefgegevens.
Dit betekent dat, voordat het monster werd gekozen, er een kans was van #0.95# dat een steekproef zou worden gekozen dat zou leiden tot een #CI# met erin de werkelijke waarde van die parameter.
Dit houdt in dat als we #100# aselecte steekproeven nemen van de polulatie en gebruik maken van dezelfde procedure om een #95\%# #CI# te berekenen voor elk van deze monsters, we zouden verwachten dat #95# van de #CI#s de werkelijke waarde van de parameter bevatten en ongeveer #5# van hen deze niet bevatten.
Natuurlijk, zolang de werkelijke waarde van de parameter niet bekend is, kunnen we niet zeggen welke #CI#s de werkelijke parameter bevatten en welke dat niet doen.
Interpretatie van een Betrouwbaarheidsinterval
Betrouwbaarheidsintervallen worden vaak verkeerd geïnterpreteerd. Zodra een betrouwbaarheidsinterval is berekend op basis van steekproefgegevens, is het niet langer correct om het woord "kans" te gebruiken in verband met het betrouwbaarheidsinterval.
Het is dus onjuist te zeggen: "Er is een #95\%# kans dat de werkelijke waarde van de parameter is opgenomen in het betrouwbaarheidsinterval." De werkelijke waarde van de parameter is immers niet willekeurig; Het is ofwel in het betrouwbaarheidsinterval of het is dit niet.
Wat we wel kunnen zeggen, is echter: "We zijn #95\%# ervan overtuigd dat de werkelijke waarde van de parameter is opgenomen in het betrouwbaarheidsinterval."
omptest.org als je een OMPT examen moet maken.