Hoofdstuk 1: Beschrijvende statistiek: Variabiliteit
Identificeren van uitschieters met de interkwartielafstand-regel
Een veelgebruikte methode voor het identificeren van uitschieters is de interkwartielafstand-regel.
Interkwartielafstand-regel
Volgens de interkwartielafstand-regel wordt een score #X# als een uitschieter beschouwd indien:
- De score meer dan #1.5\cdot IQR\,# onder het eerste kwartiel ligt: \[X < (Q_1 - 1.5\cdot IQR)\]
- De score meer dan #1.5\cdot IQR\,# boven het derde kwartiel ligt: \[X > (Q_3 + 1.5\cdot IQR)\]
Gegeven is de onderstaande steekproef van #13# scores:
\[69,\,\,\,80,\,\,\,69,\,\,\,80,\,\,\,78,\,\,\,69,\,\,\,76,\,\,\,84,\,\,\,65,\,\,\,92,\,\,\,69,\,\,\,83,\,\,\,62\]
Op basis van de interkwartielafstand regel, hoeveel uitschieters zijn er in deze steefproef?
Om de interkwartielafstand te berekenen, sorteer je eerst de waardes in oplopende volgorde:
\[62,\,\,\,65,\,\,\,69,\,\,\,69,\,\,\,69,\,\,\,69,\,\,\,76,\,\,\,78,\,\,\,80,\,\,\,80,\,\,\,83,\,\,\,84,\,\,\,92\]
Vervolgens bereken je het eerste kwartiel. Om de index #i_1# van het eerste kwartiel (#Q=1#) te vinden, gebruik je de volgende formule:
\[\begin{array}{rcl}
i_1 &=& \cfrac{Q}{4}(n-1)+1\\
&=& \cfrac{1}{4}(13 - 1) + 1=4
\end{array}\]
Omdat #i_1=4# een geheel getal is, is het eerste kwartiel de score op de #4^{e}# positie van de gesorteerde data:ordered data:
\[X_{4} = 69\]
Vervolgens bereken je het derde kwartiel. Om de index #i_3# van het derde kwartiel (#Q=3#) te vinden, gebruik je de volgende formule:
\[\begin{array}{rcl}
i_3 &=& \cfrac{Q}{4}(n-1)+1\\
&=& \cfrac{3}{4}(13 - 1) + 1=10
\end{array}\]
Omdat #i_3=10# een geheel getal is, is het derde kwartiel de score op de #10^{e}# positie van de gesorteerde data:
\[X_{10} = 80\]
Bereken je de interkwartielafstand:
\[\text{IQR}=Q_3-Q_1=80-69=11\]
Volgends de interkwartielafstand regel, is een score #X# een uitschieter als:
- De score meer dan #1.5\cdot IQR\,# onder het eerste kwartiel ligt: #X < (Q_1 - 1.5\cdot IQR)#
\[Q_1 - 1.5\cdot IQR = 69 - 1.5 \cdot 11 = 52.5\] - De score meer dan #1.5\cdot IQR\,# boven het derde kwartiel ligt: #X > (Q_3 + 1.5\cdot IQR)#
\[Q_3 + 1.5\cdot IQR = 80 + 1.5 \cdot 11 = 96.5\]
Dit betekent dat een score #X<52.5# or #X>96.5# een uitschieter is, waarvan er #0# zijn in de steekproef.
omptest.org als je een OMPT examen moet maken.