Hoofdstuk 8: Toetsen voor verschillen in gemiddelden en proporties: T-Toets voor twee onafhankelijke steekproeven
Onafhankelijke t-toets: Toetsingsgrootheid en p-waarde
Onafhankelijke t-toets: Toetsingsgrootheid
De toetsingsgrootheid van een onafhankelijke #t#-toets wordt aangeduid als #t#, en wordt berekend met de volgende formule:
\[t=\cfrac{(\bar{X}_1-\bar{X}_2) - (\mu_1 - \mu_2)}{s_{(\bar{X}_1 - \bar{X}_2)}} = \cfrac{\bar{X}_1-\bar{X}_2 }{\sqrt{\cfrac{s^2_1}{n_1}+\cfrac{s^2_2}{n_2}}}\]
waarbij #s_{(\bar{X_1} - \bar{X_2})}# de geschatte standaardfout van het gemiddelde verschil is.
Onder de nulhypothese van een onafhankelijke #t#-toets, volgt de #t#-statistiek de #t_{df}#-verdeling, maar de exacte vrijheidsgraden #df# worden bepaald door een ingewikkelde formule.
We zullen een eenvoudigere, meer conservatieve waarde gebruiken: #df# is de kleinste van #n_1-1# en #n_2-1#.
\[df=min(n_1-1, n_2-1)\]
De p-waarde van een onafhankelijke t-toets berekenen met statistische software
Hoe je de #p#-waarde van een onafhankelijke #t#-toets berekent, is afhankelijk van de richting van de toets. De berekening kan worden uitgevoerd met behulp van Excel of R.
Gebruik een van de volgende commands om de #p#-waarde van een onafhankelijke #t#-toets voor #\mu_1-\mu_2# in Excel te berekenen:
\[\begin{array}{llll}
\phantom{0}\text{Richting}&\phantom{000000}H_0&\phantom{000000}H_a&\phantom{0000000}\text{Excel Command}\\
\hline
\text{Tweezijdig}&H_0:\mu_1 - \mu_2 = 0&H_a:\mu_1 - \mu_2 \neq 0&=2 \text{ * }(1 \text{ - } \text{T.DIST}(\text{ABS}(t),df,1))\\
\text{Linkszijdig}&H_0:\mu_1 - \mu_2 \geq 0&H_a:\mu_1 - \mu_2 \lt 0&=\text{T.DIST}(t,df,1)\\
\text{Rechtszijdig}&H_0:\mu_1 - \mu_2 \leq 0&H_a:\mu_1 - \mu_2 \gt 0&=1\text{ - }\text{T.DIST}(t,df,1)\\
\end{array}\]
Waar #df=\text{MIN}(n_1\text{ - }1, n_2\text{ - }1)#.
Gebruik een van de volgende commands om de #p#-waarde van een onafhankelijke #t#-toets voor #\mu_1 - \mu_2# in R te berekenen:
\[\begin{array}{llll}
\phantom{0}\text{Ricchting}&\phantom{000000}H_0&\phantom{000000}H_a&\phantom{00000000000}\text{R Command}\\
\hline
\text{Tweezijdig}&H_0:\mu_1 - \mu_2 = 0&H_a:\mu_1 - \mu_2 \neq 0&2 \text{ * }\text{pt}(\text{abs}(t),df,lower.tail=\text{FALSE})\\
\text{Linkszijdig}&H_0:\mu_1 - \mu_2 \geq 0&H_a:\mu_1 - \mu_2 \lt 0&\text{pt}(t,df, lower.tail=\text{TRUE})\\
\text{Rechtszijdig}&H_0:\mu_1 - \mu_2 \leq 0&H_a:\mu_1 - \mu_2 \gt 0&\text{pt}(t,df, lower.tail=\text{FALSE})\\
\end{array}\]
Waar #df=\text{min}(n_1\text{ - }1, n_2\text{ - }1)#.
Als #p \leq \alpha#, verwerp #H_0# en concludeer #H_a#. Verwerp #H_0# anders niet.
Er worden in totaal #80# proefpersonen geworven. Ongeveer de helft van de proefpersonen krijgt de makkelijk leesbare tekst #(X_1)# en de andere helft krijgt de moeilijk leesbare tekst #(X_2)#. Beide groepen krijgen #20# minuten de tijd om de tekst te bestuderen, waarna wordt getest hoe goed ze onthouden wat ze hebben gelezen.
De psycholoog is van plan een onafhankelijke #t#-toets te gebruiken om te bepalen of er een significant verschil is in de geheugenprestaties tussen de twee groepen, op het #\alpha = 0.06# significantieniveau.
De psycholoog krijgt de volgende resultaten:
Gemakkelijk te lezen #(X_1)# | Moeilijk te lezen #(X_2)# |
\[\begin{array}{rcl} |
\[\begin{array}{rcl} |
Bereken de #p#-waarde van de toets en neem een beslissing over #H_0: \mu_1 - \mu_2 = 0#. Rond je antwoord af op #3# decimalen.
#p=0.028#
Op basis van deze #p#-waarde wordt #H_0# wel verworpen, omdat #\,p# #\lt# #\alpha#.
Er zijn een aantal verschillende manieren waarop we de #p#-waarde van de toets kunnen berekenen. Klik op één van de panelen om de desbetreffende oplossing te bekijken.
Bereken de geschatte standaardfout van het gemiddelde verschil:
\[s_{(\bar{X}_1-\bar{X}_2)} = \sqrt{\cfrac{s^2_1}{n_1}+\cfrac{s^2_2}{n_2}} = \sqrt{\cfrac{3.8^2}{42}+\cfrac{4.0^2}{38}} = 0.87456\]
Bereken de #t#-statistiek:
\[t=\cfrac{\bar{X_1}-\bar{X_2}}{s_{(\bar{X}_1-\bar{X}_2)}}=\cfrac{28.3 - 30.3}{0.87456}=-2.2869\]
Bepaal de vrijheidsgraden:
\[df = min(n_1-1, n_2-1) = min( 41 , 37 )= 37 \]
Omdat zowel #n_1 # als # n_2 # beschouwd wordt als groot (# \gt 30#), is de centrale limietstelling van toepassing en weten we dat de toetsingsgrootheid
\[t=\cfrac{\bar{X_1}-\bar{X_2}}{ \sqrt{\cfrac{s^2_1}{n_1}+\cfrac{s^2_2}{n_2}}}\]
ongeveer de #t_{df} = t_{37}# verdeling heeft, onder de aanname dat #H_0# waar is.
Om de #p#-waarde van een #t #-toets te berekenen, gebruik je de volgende Excel functie:
T.DIST(x, deg_freedom, cumulative)
- x: De waarde waarvoor je de kans wilt berekenen.
- deg_freedom: Een getal dat het aantal vrijheidsgraden aangeeft.
- cumulative: Een logische waarde die de vorm van de functie bepaalt.
- TRUE - gebruikt de cumulatieve verdelingsfunctie, #\mathbb{P}(X \leq x)#
- FALSE - gebruikt de kansdichtheidsfunctie
Omdat dit een tweezijdige # t#-toets is, voer je het volgende commando uit om de #p#-waarde te berekenen:
\[
=2 \text{ * }(1 \text{ - } \text{T.DIST}(\text{ABS}(t),df,1))\\
\downarrow\\
=2 \text{ * }(1 \text{ - } \text{T.DIST}(\text{ABS}( \text{-}2.28685 ), 37 ,1))
\]
Dit geeft:
\[p = 0.028\]
Omdat #\,p# #\lt# #\alpha#, moet #H_0: \mu_1 - \mu_2 = 0# wel worden verworpen.
Bereken de geschatte standaardfout van het gemiddelde verschil :
\[s_{(\bar{X}_1-\bar{X}_2)} = \sqrt{\cfrac{s^2_1}{n_1}+\cfrac{s^2_2}{n_2}} = \sqrt{\cfrac{3.8^2}{42}+\cfrac{4.0^2}{38}} = 0.87456\]
Bereken de #t#-statistiek:
\[t=\cfrac{\bar{X_1}-\bar{X_2}}{s_{(\bar{X}_1-\bar{X}_2)}}=\cfrac{28.3 - 30.3}{0.87456}=-2.2869\]
Bepaal de vrijheidsgraden:
\[df = min(n_1-1, n_2-1) = min( 41 , 37 )= 37 \]
Omdat zowel #n_1 # als # n_2 # beschouwd wordt als groot (# \gt 30#), is de centrale limietstelling van toepassing en weten we dat de toetsingsgrootheid
\[t=\cfrac{\bar{X_1}-\bar{X_2}}{ \sqrt{\cfrac{s^2_1}{n_1}+\cfrac{s^2_2}{n_2}}}\]
ongeveer de #t_{df} = t_{37}# verdeling heeft, onder de aanname dat #H_0# waar is.
Om de #p#-waarde van een #t#-toets te berekenen, maak je gebruik van de volgende R functie:
pt(q, df, lower.tail)
- q: De waarde waarvoor je de kans wilt berekenen.
- df: Een getal dat het aantal vrijheidsgraden aangeeft.
- lower.tail: Als TRUE (standaard), dan #\mathbb{P}(X \leq x)#, anders, #\mathbb{P}(X \gt x)#.
Omdat we te maken hebben met een tweezijdige #t#-toets, voer je het volgende commando uit om de #p#-waarde te berekenen:
\[
2 \text{ * } \text{pt}(q = \text{abs}(t), df = \text{min}(n_1 \text{ - } 1,n_2 \text{ - } 1), lower.tail = \text{FALSE})\\
\downarrow\\
2\text{ * } \text{pt}(q = \text{abs}( \text{-}2.28685 ), df = 37 , lower.tail = \text{FALSE})
\]
Dit geeft:
\[p = 0.028\]
Omdat #\,p# #\lt# #\alpha#, moet #H_0: \mu_1 - \mu_2 = 0# wel worden verworpen.
omptest.org als je een OMPT examen moet maken.