Hoofdstuk 9: Chi-kwadraat toetsen: Chi-kwadraat Aanpassingstoets
Chi-kwadraat Aanpassingstoets: Doel, Hypothesen, en Aannames
Chi-kwadraat Aanpassingstoets: Doel, Hypothesen
De Chi-kwadraat Aanpassingstoets (ook wel Chi-kwadraattoets voor Goodness of Fit genoemd) gebruikt de steekproefdata van een categorische variabele om hypothesen over de proporties van een populatieverdeling te toetsen.
In het bijzonder bepaalt de toets hoe goed de waargenomen steekproefproporties overeenkomen met de populatieproporties voorspeld door de nulhypothese.
De nulhypothese van een aanpassingstoets doet een voorspelling over de proportie (of het percentage) van de populatie in elk van de meetcategorieën. Hoewel het mogelijk is om elke veronderstelde proportie voor de nulhypothese te kiezen, valt de nulhypothese over het algemeen in een van de volgende twee categorieën:
- Geen voorkeur
Een nulhypothese van geen voorkeur wordt gebruikt om te bepalen of er voorkeuren bestaan tussen de meetcategorieën; of de proporties verschillen van categorie tot categorie.
Hier voorspelt #H_0# dat de populatie gelijkmatig over alle categorieën is verdeeld.
#\phantom{0}#
Bijvoorbeeld, een nulhypothese die stelt dat er geen voorkeur bestaat onder de #4# de populairste ijssmaken, zou de volgende populatieverdeling voorspellen:
Chocolade | Vanille | Aardbei | Banaan | |
#H_0:# | #1/4# | #1/4# | #1/4# | #1/4# |
- Geen verschil met een bekende populatie
Anderzijds willen we misschien bepalen of de onbekende proporties voor de ene populatie significant verschillen van de proporties voor een andere populatie waarvan de verdeling al bekend is.
Een nulhypothese dat er geen verschil is, voorspelt dat de proporties voor de onbekende populatie identiek zijn aan de proporties voor de bekende populatie.
#\phantom{0}#
Bijvoorbeeld, stel dat bekend is dat #22\%# van de studenten aan de Universiteit van Amsterdam de voorkeur geeft aan colleges in de ochtend, #65\%# van de studenten de voorkeur geeft aan colleges in de middag, en de overige #13\%# van de studenten de voorkeur geeft aan avondcolleges. Een hoogleraar aan de Erasmus Universiteit in Rotterdam vraagt zich af of deze proporties ook gelden voor haar eigen studenten.
De nulhypothese zou hier stellen dat de verdeling van studenten aan de Erasmus Universiteit identiek is aan de verdeling van studenten aan de Universiteit van Amsterdam:
Voorkeur voor ochtend colleges |
Voorkeur voor middag colleges |
Voorkeur voor avondcolleges | |
#H_0:# | #.22# | #.65# | #.13# |
Omdat de nulhypothese #H_0# van een aanpassingstoets een exacte voorspelling doet over de verdeling voor de populatie, voorspelt de alternatieve hypothese #H_a# simpelweg dat de populatie een andere verdeling heeft dan voorspeld door de nulhypothese.
Aannames van de Chi-kwadraat Aanpassingstoets
De volgende aannames moeten gelden zodat een chi-kwadraat aanpassingstoets geldige resultaten oplevert:
- De variabele die wordt bestudeerd is categorisch (kwalitatief) van aard.
- De meetcategorieën sluiten elkaar uit, wat betekent dat elke waarneming in precies één categorie kan worden ingedeeld.
- Willekeurige steekproeven worden gebruikt om de steekproeven te trekken.
- Alle categorieën moeten een verwachte frequentie van minimaal #1# hebben.
- De meeste categorieën #(\geq 80\%)# moeten een verwachte frequentie van minimaal #5# hebben.
Als aan aannames #4# en/of #5# niet wordt voldaan, voeg je een aantal categorieën samen.
omptest.org als je een OMPT examen moet maken.