Hoofdstuk 1: Beschrijvende statistiek: Centrummaten
Gemiddelde
Gemiddelde
Definitie
Het gemiddelde van een verdeling wordt berekend door de som van alle scores te delen door het totaal aantal waarnemingen.
Het steekproefgemiddelde van een variabele #X# wordt aangeduid als #\bar{X}#.
Formule
\[\bar{X} = \cfrac{\sum{X}}{n}\]
Berekenen van het Gemiddelde met Statistische Software
Om het gemiddelde van een steekproef in Excel te berekenen, gebruiken we de volgende functie:
AVERAGE(array)
- array: De reeks of celbereik van numerieke waarden waarvoor je het gemiddelde wilt berekenen.
Om het gemiddelde van een steekproef in R te berekenen, gebruiken we de volgende functie:
mean(x)
- x: De numerieke vector waarvan je het gemiddelde wilt berekenen.
Gegeven is de volgende steekproef.
\[9,\,\,\,8,\,\,\,4,\,\,\,2,\,\,\,1,\,\,\,6\]
Bereken het gemiddelde.
#\bar{X}=5#
Er bestaan een aantal manieren op het gemiddelde te berekenen. Klik op één van de panelen om de desbetreffende oplossing te bekijken.
\[\begin{array}{rcl}
\bar{X} &=& \cfrac{\displaystyle\sum{X}}{n}\\\\
&=& \cfrac{X_1 + X_2 + \ldots + X_{n}}{n}\\\\
&=& \cfrac{9+8+4+2+1+6}{6}\\\\\
&=& \cfrac{30}{6}\\\\
&=& 5
\end{array}\]
Ervantuigaande dat de scores in cel A1 tot en met A6 staan, moeten we dus het volgende Excel commando uitvoeren:AVERAGE(array)
- array: De reeks of celbereik van numerieke waarden waarvoor je het gemiddelde wilt berekenen.
\[= \text{AVERAGE(A1:A6)}\]
Dit geeft:
\[\bar{X} = 5\]
Het R commando om het gemiddelde te berekenen is dus:mean(x)
- x: De numerieke vector waarvan je het gemiddelde wilt berekenen.
\[mean(x = c(9,8,4,2,1,6))\]
Dit geeft:
\[\bar{X}=5\]
Het gemiddelde van een verdeling kan alleen berekend worden wanneer de data gemeten is op een interval- of ratioschaal.
\[
\begin{array}{c|cccc}
&\text{Nominaal}&\text{Ordinaal}&\text{Interval}&\text{Ratio}\\
\hline
\text{Modus}&\green{\text{Ja}}&\green{\text{Ja}}&\green{\text{Ja}}&\green{\text{Ja}}\\
\text{Mediaan}&\red{\text{Nee}}&\green{\text{Ja}}&\green{\text{Ja}}&\green{\text{Ja}}\\
\text{Gemiddelde}&\red{\text{Nee}}&\red{\text{Nee}}&\green{\text{Ja}}&\green{\text{Ja}}\\
\end{array}
\]
Het gemiddelde is met name een geschikte centrummaat voor (ongeveer) symmetrische verdelingen. Als de data erg scheef verdeeld is, dan is de mediaan vaak de beste representatie van het centrum van de verdeling.
omptest.org als je een OMPT examen moet maken.