Hoofdstuk 8: Toetsen voor verschillen in gemiddelden en proporties: T-Toets voor twee gepaarde steekproeven
Betrouwbaarheidsinterval voor een Gemiddeld Verschil
Betrouwbaarheidsinterval voor een Populatie Gemiddeld Verschil
Aannemend dat de steekproefverdeling van het steekproef gemiddelde verschil (ongeveer) normaal is, is de algemene formule voor het berekenen van een #C\%\,CI# voor een populatie gemiddelde verschil #\mu_D#, gebaseerd op een willekeurige steekproef van #n# verschilscores:
\[CI_{\mu_D}=\bigg(\bar{D} - t^*\cdot \cfrac{s_D}{\sqrt{n}},\,\,\,\, \bar{D} + t^*\cdot \cfrac{s_D}{\sqrt{n}} \bigg)\]
Waar #t^*# de kritische waarde is van de #t_{n-1}# verdeling zodat #\mathbb{P}(-t^* \leq t \leq t^*)=\frac{C}{100}#.
Het Berekenen van t* met Statistische Software
Laat #C# het betrouwbaarheidsinterval zijn in #\%#.
Om de kritische waarde #t^*# te berekenen in Excel, gebruik je de functie T.INV():
\[=\text{T.INV}((100+C)/200, n \text{ - } 1)\]
Om de kritische waarde #t^*# te berekenen in R, gebruik je de functie qt():
\[\text{qt}(p=(100+C)/200, df=n \text{ - } 1,lower.tail = \text{TRUE})\]
Een onderzoeker voert een experiment uit waarbij #11# willekeurig geselecteerde studenten op twee verschillende avonden worden uitgenodigd om te dineren in een restaurant. Op de ene avond krijgt elke student een normaal bord en op de andere avond een groot bord.
Bij elke gelegenheid mogen de studenten zoveel eten kiezen als ze willen van een buffet. Nadat de leerlingen hun keuze hebben gemaakt, worden hun borden gewogen.
De onderstaande tabel laat zien hoeveel voedsel (in grammen) elke leerling koos wanneer ze een normaal bord #(X)# kregen en wanneer ze een groot bord #(Y)# kregen:
\[\begin{array}{|l|c|c|c|c|c|c|c|c|c|c|c|}\hline \text{Student} & 1 & 2 & 3 & 4 & 5 & 6 & 7 & 8 & 9 & 10 & 11\\ \hline X \text{: Normaal} &322&307&320&436&394&360&424&415&418&367&377\\ \hline Y \text{: Groot} &310&358&285&482&460&415&482&392&444&394&400\\ \hline \end{array}\]
Je mag ervan uitgaan dat de hoeveelheid gegeten voedsel voor beide bordformaten normaal verdeeld is.
Definieer #D=Y-X# en construeer een #95\%# betrouwbaarheidsinterval voor het populatie gemiddelde verschil #\mu_D#. Rond je antwoorden af op #3# decimalen.
#CI_{\mu,\,95\%}=(2.302,\,\,\, 48.971)#
Er zijn een aantal verschillende manieren waarop we het betrouwbaarheidsinterval kunnen berekenen. Klik op één van de panelen om de desbetreffende oplossing te bekijken.
\[\begin{array}{|l|c|c|c|c|c|c|c|c|c|c|c|}\hline \text{Student} & 1 & 2 & 3 & 4 & 5 & 6 & 7 & 8 & 9 & 10 & 11\\ \hline X \text{: Normaal} &322&307&320&436&394&360&424&415&418&367&377\\ \hline Y \text{: Groot} &310&358&285&482&460&415&482&392&444&394&400\\ \hline D \text{: Verschil} &-12&51&-35&46&66&55&58&-23&26&27&23\\ \hline \end{array}\]
Ervan uitgaande dat de hoeveelheid gegeten voedsel voor beide bordmaten normaal verdeeld is, weten we dat de steekproefverdeling van het steekproef gemiddelde verschil ook normaal verdeeld is.
Als de steekproefverdeling van het steekproef gemiddelde verschil (ongeveer) normaal is, is de algemene formule voor het berekenen van een #C\%\,CI# voor een populatie gemiddelde verschil #\mu_D#, gebaseerd op een willekeurige steekproef van grootte #n#:
\[CI_{\mu_D}=\bigg(\bar{D} - t^*\cdot \cfrac{s_D}{\sqrt{n}},\,\,\,\, \bar{D} + t^*\cdot \cfrac{s_D}{\sqrt{n}} \bigg)\]
Bereken het gemiddelde van de verschilscores #\bar{D} #:
\[\bar{D}=\cfrac{\sum{D}}{n} = \cfrac{-12+51-35+46+66+55+58-23+26+27+23}{11}=25.6364\]
Bereken de standaardafwijking van de verschilscores # s_{D} #:
\[\sum{D}=-12+51-35+46+66+55+58-23+26+27+23=282\]
\[\begin{array}{rcl}\sum{D^2}&=&(-12)^2+51^2+(-35)^2+46^2+66^2+55^2+58^2+(-23)^2+26^2+27^2\\&&+23^2\\&=&19294\end{array}\]
\[s_{D}=\sqrt{\cfrac{\sum{D^2} - \cfrac{(\sum{D})^2}{n} }{n-1}}=\sqrt{\cfrac{19294 - \cfrac{282^2}{11} }{11-1}}=34.7341\]
Voor een gegeven betrouwbaarheidsniveau # C # (in # \% #), is de kritische waarde # t^* # van de # t_{n-1} #-verdeling de waarde zodanig dat # \mathbb{P}(-t^* \leq t \leq t^*)=\cfrac{C}{100} #.
Om deze kritische waarde #t^*# in Excel te berekenen, gebruik je de volgende functie:
T.INV(probability, deg_freedom)
- probability: Een kans die overeenkomt met de normale verdeling.
- deg_freedom: Het gemiddelde van de verdeling.
Hier hebben we # C= 95 #. Om # t^* # zo te berekenen dat # \mathbb{P}(-t^* \leq t \leq t^*)= 0.95 #, voer je dus het volgende commando uit:
\[\begin{array}{c}
=\text{T.INV}((100+C)/200, n - 1)\\
\downarrow\\
=\text{T.INV}(195/200, 11 \text{ - } 1)
\end{array}\]
Dit geeft:
\[t^* = 2.22814\]
Bereken de ondergrens #L# van het betrouwbaarheidsinterval:
\[L = \bar{D} - t^* \cdot \cfrac{s_D}{\sqrt{n}} = 25.6364 - 2.22814 \cdot \cfrac{34.7341}{\sqrt{11}}=2.302\]
Bereken de bovengrens #U# van het betrouwbaarheidsinterval:
\[U = \bar{D} + t^* \cdot \cfrac{s_D}{\sqrt{n}} = 25.6364 + 2.22814 \cdot \cfrac{34.7341}{\sqrt{11}}=48.971\]
Het # 95 \% # betrouwbaarheidsinterval voor het populatie gemiddelde verschil # \mu_D# is dus:
\[CI_{\mu_D,\,95\%}=(2.302,\,\,\, 48.971)\]
\[\begin{array}{|l|c|c|c|c|c|c|c|c|c|c|c|}\hline \text{Student} & 1 & 2 & 3 & 4 & 5 & 6 & 7 & 8 & 9 & 10 & 11\\ \hline X \text{: Normaal} &322&307&320&436&394&360&424&415&418&367&377\\ \hline Y \text{: Groot} &310&358&285&482&460&415&482&392&444&394&400\\ \hline D \text{: Verschil} &-12&51&-35&46&66&55&58&-23&26&27&23\\ \hline \end{array}\]
Ervan uitgaande dat de hoeveelheid gegeten voedsel voor beide bordmaten normaal verdeeld is, weten we dat de steekproefverdeling van het steekproef gemiddelde verschil ook normaal verdeeld is.
Als de steekproefverdeling van het steekproef gemiddelde verschil (ongeveer) normaal is, is de algemene formule voor het berekenen van een #C\%\,CI# voor een populatie gemiddelde verschil #\mu_D#, gebaseerd op een willekeurige steekproef van grootte #n#:
\[CI_{\mu_D}=\bigg(\bar{D} - t^*\cdot \cfrac{s_D}{\sqrt{n}},\,\,\,\, \bar{D} + t^*\cdot \cfrac{s_D}{\sqrt{n}} \bigg)\]
Bereken het gemiddelde van de verschilscores #\bar{D} #:
\[\bar{D}=\cfrac{\sum{D}}{n} = \cfrac{-12+51-35+46+66+55+58-23+26+27+23}{11}=25.6364\]
Bereken de standaardafwijking van de verschilscores # s_{D} #:
\[\sum{D}=-12+51-35+46+66+55+58-23+26+27+23=282\]
\[\begin{array}{rcl}\sum{D^2}&=&(-12)^2+51^2+(-35)^2+46^2+66^2+55^2+58^2+(-23)^2+26^2+27^2\\&&+23^2\\&=&19294\end{array}\]
\[s_{D}=\sqrt{\cfrac{\sum{D^2} - \cfrac{(\sum{D})^2}{n} }{n-1}}=\sqrt{\cfrac{19294 - \cfrac{282^2}{11} }{11-1}}=34.7341\]
Voor een gegeven betrouwbaarheidsniveau # C # (in # \% #), is de kritische waarde # t^* # van de # t_{n-1} #-verdeling de waarde zodanig dat # \mathbb{P}(-t^* \leq t \leq t^*)=\cfrac{C}{100} #.
Om deze kritische waarde # t^*# te berekenen in R, gebruik je de volgende functie:
qt(p, df, lower.tail)
- p : Een kans die overeenkomt met de normale verdeling.
- df : Een geheel getal dat het aantal vrijheidsgraden aangeeft.
- lower.tail : Indien TRUE (standaard), zijn de kansen #\mathbb{P}(X \leq x)#, anders #\mathbb{P}(X \gt x)#.
Hier hebben we #C= 95 #. Om #t^*# te berekenen zodanig dat # \mathbb{P}(-t^* \leq t \leq t^*)= 0.95 #, voer je dus het volgende commando uit:
\[\begin{array}{c}
\text{qt}(p = (100+C)/200, df = n \text{ - } 1, lower.tail = \text{TRUE})\\
\downarrow\\
\text{qt}(p =195/200, df = 11 \text { - } 1, lower.tail = \text{TRUE})
\end{array}\]
Dit geeft:
\[t^* = 2.22814\]
Bereken de ondergrens #L# van het betrouwbaarheidsinterval:
\[L = \bar{D} - t^* \cdot \cfrac{s_D}{\sqrt{n}} = 25.6364 - 2.22814 \cdot \cfrac{34.7341}{\sqrt{11}}=2.302\]
Bereken de bovengrens #U# van het betrouwbaarheidsinterval:
\[U = \bar{D} + t^* \cdot \cfrac{s_D}{\sqrt{n}} = 25.6364 + 2.22814 \cdot \cfrac{34.7341}{\sqrt{11}}=48.971\]
Het # 95 \% # betrouwbaarheidsinterval voor het populatie gemiddelde verschil # \mu_D# is dus:
\[CI_{\mu_D,\,95\%}=(2.302,\,\,\, 48.971)\]
#\phantom{0}#
Verband met Hypothesetoetsen
Er bestaat een directe verbinding tussen een tweezijdige gepaarde #t#-toets voor #\mu_D# en een #(1-\alpha)\cdot 100\%# betrouwbaarheidsinterval voor #\mu_D#:
- Als #0# binnen het #(1 - \alpha)\cdot 100\%\,CI# valt, dan mag #H_0: \mu_D=0# niet verworpen worden op een #\alpha# significantieniveau.
- Als #0# buiten het #(1 - \alpha)\cdot 100\%\,CI# valt, dan moet #H_0: \mu_D=0# worden verworpen op een #\alpha# significantieniveau.
Stel dat je dezelde steekproef van verschilscores gebruikt om #H_0: \mu_D = 0# tegen #H_a: \mu_D \neq 0# te toetsen op een #\alpha = 0.10# significantieniveau.
Wat zou de conclusie zijn?
Omdat het #90\%# betrouwbaarheidsinterval #(-0.998,\,\,1.206)# de waarde #0# bevat, zouden we #H_0: \mu_D = 0# niet verwerpen op een #\alpha = 0.10# significantieniveau.
omptest.org als je een OMPT examen moet maken.