Hoofdstuk 7: Hypothese toetsen: T-Toets voor één steekproef
T-Toets voor één steekproef: Teststatistiek en p-waarde
T-toets voor één steekproef: Teststatistiek
De teststatistiek van een #t#-toets voor één steekproef voor een populatiegemiddelde #\mu# wordt aangeduid als #t#.
De berekening van de #t#-statistiek is bijna identiek aan de berekening van de #Z#-statistiek. Het enige verschil is:
- De #Z#-statistiek wordt berekend met de (werkelijke) #\blue{\text{standaardfout van het gemiddelde}\,\sigma_{\bar{X}}}#.
\[Z = \cfrac{\bar{X}-\mu_0}{\blue{\sigma_{\bar{X}}}} = \cfrac{\bar{X}-\mu_0}{\blue{\sigma/\sqrt{n}}}\phantom{00000000000000}\] - De #t#-statistiek wordt berekend met de #\orange{\text{geschatte standaardfout van het gemiddelde}\,s_{\bar{X}}}#.
\[t = \cfrac{\bar{X}-\mu_0}{\orange{s_{\bar{X}}}} = \cfrac{\bar{X}-\mu_0}{\orange{s/\sqrt{n}}}\phantom{00000000000000}\]
Onder de nulhypothese van een #t#-toets voor één steekproef volgt de #t#-statistiek een #t#-verdeling met #df = n - 1# vrijheidsgraden.
\[t \sim t_{n-1}\]
Studentverdeling
De vorm van een #\boldsymbol{t}#-verdeling lijkt erg op die van de standaard normale verdeling, behalve dat deze dikkere staarten en een lagere piek heeft. De exacte vorm is afhankelijk van het aantal vrijheidsgraden.
Naarmate het aantal vrijheidsgraden toeneemt, neemt het verschil tussen de steekproefstandaardafwijking #s# en de populatiestandaardafwijking #\sigma# af en zal de #t#-verdeling neigen naar de standaard normale verdeling.
De p-waarde berekenen van een t-toets met één steekproef voor een populatiegemiddelde met statistische software
De berekening van de #p#-waarde van een #t#-toets voor #\mu# is afhankelijk van de richting van de toets en kan worden uitgevoerd met Excel of R.
Gebruik een van de volgende functies om de #p#-waarde van een #t#-toets voor #\mu# in Excel te berekenen:
\[\begin{array}{llll}
\phantom{0}\text{Richting}&\phantom{0000}H_0&\phantom{0000}H_a&\phantom{000000000}\text{Excel Functie}\\
\hline
\text{Tweezijdig}&H_0:\mu = \mu_0&H_a:\mu \neq \mu_0&=2 \text{ * }(1 \text{ - } \text{T.DIST}(\text{ABS}(t),n\text{ - }1,1))\\
\text{Linkszijdig}&H_0:\mu \geq \mu_0&H_a:\mu \lt \mu_0&=\text{T.DIST}(t,n\text{ - }1,1)\\
\text{Rechtszijdig}&H_0:\mu \leq \mu_0&H_a:\mu \gt \mu_0&=1\text{ - }\text{T.DIST}(t,n\text{ - }1,1)\\
\end{array}\]
Gebruik een van de volgende functies om de #p#-waarde van een #t#-toets voor #\mu# in R te berekenen:
\[\begin{array}{llll}
\phantom{0}\text{Richting}&\phantom{0000}H_0&\phantom{0000}H_a&\phantom{00000000000}\text{R Functie}\\
\hline
\text{Tweezijdig}&H_0:\mu = \mu_0&H_a:\mu \neq \mu_0&2 \text{ * }\text{pt}(\text{abs}(t),n\text{ - }1,lower.tail=\text{FALSE})\\
\text{Linkszijdig}&H_0:\mu \geq \mu_0&H_a:\mu \lt \mu_0&\text{pt}(t,n\text{ - }1, lower.tail=\text{TRUE})\\
\text{Rechtszijdig}&H_0:\mu \leq \mu_0&H_a:\mu \gt \mu_0&\text{pt}(t,n\text{ - }1, lower.tail=\text{FALSE})\\
\end{array}\]
Indien #p \leq \alpha#, verwerp je #H_0# en neem je #H_a# aan. Anders verwerp je #H_0#.
De ingenieur verzamelt een aselecte steekproef van #40# nieuwe batterijen en meet de prestaties van elke batterij.
Ze is van plan een #t#-toets met één steekproef te gebruiken om te bepalen of de gemiddelde actieradius van de nieuwe batterij significant verschilt van #455# km, op het #\alpha = 0.08# significantieniveau.
Het steekproefgemiddelde #\bar{X}# blijkt #459.5# km te zijn met een standaardafwijking van #s=11.2# km.
Bereken de #p#-waarde van de toets en neem een beslissing over #H_0#. Rond je antwoord af op #4# decimalen.
Op basis van deze #p#-waarde, moet #H_0# wel worden verworpen, omdat #\,p# #\lt# #\alpha#.
Er zijn een aantal verschillende manieren waarop we de #p#-waarde van de toets kunnen berekenen. Klik op een van de panelen om naar een specifieke oplossing te gaan.
Een steekproefgrootte van #n=40# wordt groot genoeg geacht om de Centrale Limietstelling toe te passen.
Dit betekent dat, hoewel de steekproef in kwestie afkomstig is uit een populatie met een onbekende verdeling, de teststatistiek
\[t=\cfrac{\bar{X} - \mu_0}{s/\sqrt{n}}\]
bij benadering de #t_{n-1} = t_{39}# verdeling heeft, onder de aanname dat #H_0# waar is.
Bereken de waarde van de teststatistiek #t#:
\[t = \cfrac{\bar{X}-\mu_0}{s/\sqrt{n}} =\cfrac{459.5 - 455}{11.2/\sqrt{40}} = 2.54112\]
Om de #p#-waarde van een #t#-toets te berekenen, maak je gebruik van de volgende Excel-functie:
T.DIST(x, deg_freedom, cumulative)
- x: De waarde waarin je de verdelingsfunctie wilt evalueren.
- deg_freedom: Een geheel getal dat het aantal vrijheidsgraden aangeeft.
- cumulative: Een logische waarde die de vorm van de functie bepaalt.
- WAAR - gebruikt de cumulatieve verdelingsfunctie, #\mathbb{P}(X \leq x)#
- ONWAAR - gebruikt de kansdichtheidsfunctie
Aangezien we te maken hebben met een tweezijdige #t#-toets, voer je het volgende commando uit om de #p#-waarde te berekenen:
\[
=2 \text{ * }(1 \text{ - } \text{T.DIST}(\text{ABS}(t),n \text{ - } 1,1))\\
\downarrow\\
=2 \text{ * }(1 \text{ - } \text{T.DIST}(\text{ABS}(2.54112), 40 \text{ - } 1,1))
\]
Dit geeft:
\[p = 0.0151\]
Aangezien #\,p# #\lt# #\alpha#, moet #H_0: \mu = 455# wel worden verworpen.
Een steekproefgrootte van #n=40# wordt groot genoeg geacht om de Centrale Limietstelling toe te passen.
Dit betekent dat, hoewel de steekproef in kwestie afkomstig is uit een populatie met een onbekende verdeling, de teststatistiek
\[t=\cfrac{\bar{X} - \mu_0}{s/\sqrt{n}}\]
bij benadering de #t_{n-1} = t_{39}# verdeling heeft, onder de aanname dat #H_0# waar is.
Bereken de waarde van teststatistiek #t#:
\[t = \cfrac{\bar{X}-\mu_0}{s/\sqrt{n}} =\cfrac{459.5 - 455}{11.2/\sqrt{40}} = 2.54112\]
Om de #p#-waarde van een #t#-toets te berekenen, maak je gebruik van de volgende R-functie:
pt(q, df, lower.tail)
- q: De waarde waarin je de verdelingsfunctie wilt evalueren.
- df: Een geheel getal dat het aantal vrijheidsgraden aangeeft.
- lower.tail: Indien TRUE (standaard) geldt, is de kans #\mathbb{P}(X \leq x)#, anders, #\mathbb{P}(X \gt x)#.
Aangezien we te maken hebben met een tweezijdige #t#-toets, voer je het volgende commando uit om de #p#-waarde te berekenen:
\[
2 \text{ * } \text{pt}(q = \text{abs}(t), df = n \text{ - } 1, lower.tail = \text{FALSE})\\
\downarrow\\
2\text{ * } \text{pt}(q = \text{abs}(2.54112), df = 40 \text{ - } 1,lower.tail = \text{FALSE})
\]
Dit geeft:
\[p = 0.0151\]
Aangezien #\,p# #\lt# #\alpha#, moet #H_0: \mu = 455# wel worden verworpen.
omptest.org als je een OMPT examen moet maken.