De t-test voor het vergelijken van gemiddelden tussen groepen

De t-test begrijpen, gebruiken (SPSS) en interpreteren

...

Stel dat je wil onderzoeken of mensen die thee drinken gemiddeld een hogere bloeddruk hebben dan mensen die geen thee drinken. Als je zoekt welke statistische test je hiervoor moet gebruiken, zul je waarschijnlijk uitkomen op de t-test. Deze test wordt ook wel Student’s t-test genoemd en wordt gebruikt om de gemiddeldes van maximaal twee groepen te vergelijken. In deze blog leggen we je uit welke smaken t-testen er zijn en wanneer je ze gebruikt.
 

T-test: de voorwaarden

De t-test gebruik je om het gemiddelde (Engels: mean) van een continue variabele te vergelijken tussen maximaal 2 groepen. Continue variabelen zijn variabelen die in een bepaald interval elke mogelijke waarde kunnen hebben, zoals lengte, bloeddruk of afstand. Dit in tegenstelling tot discrete variabelen zoals geslacht of burgerlijke staat. Om de t-test te mogen gebruiken, moet je data normaal verdeeld zijn. In dat geval mag je gemiddelde en standaarddeviatie gebruiken om de spreiding van je data weer te geven.
 

Hoe weet ik of mijn data normaal verdeeld is?

Er zijn hiervoor verschillende methodes, visueel of met behulp van een test. Om te beginnen kun je je variabele plotten in een histogram (in SPSS: Graphs – Legacy Dialogs – Histogram). Als het histogram grofweg de vorm heeft van een normale curve, kun je ervan uitgaan dat je data normaal verdeeld is. In de praktijk is het echter vaak lastig in te schatten. Maak in dat geval gebruik van een Q-Q plot (in SPSS: Analyze – Descriptive Statistics – Q-Q Plots). Als de variabele normaal verdeeld is, moeten de punten op de rechte lijn liggen. Als je twijfelt, kun je er nog voor kiezen om een formele test te doen zoals de Kolmogorov-Smirnov toets of de Shapiro-Wilk toets. Deze zijn echter vaak niet nodig en de uitleg van deze toetsen ligt buiten het bestek van deze blog.
 

Mijn data is niet normaal verdeeld, wat nu?

Je kan in dat geval twee dingen doen: een transformatie uitvoeren van je data in de hoop dat het dan normaal verdeeld is of een non-parametrische test doen zoals de Mann-Whitney U toets. Deze onderwerpen komen later aan bod.
 

Welke soorten t-testen zijn er?

T-test met 1 groep: de one-sample t-test

Gebruik deze toets als je een steekproef hebt gedaan, waarvan je het gemiddelde wil vergelijken met het bekende populatiegemiddelde. Bijvoorbeeld, je hebt het BMI gemeten bij 50 mannen met suikerziekte en je wil dit vergelijken met het bekende gemiddelde BMI van mannen in Nederland. Gebruik in dit geval de one-sample t-test (in SPSS: Analyze – Compare Means – One Sample T-test).
 

T-test met onafhankelijke steekproeven: de independent-sample t-test

Gebruik deze toets om de gemiddeldes van twee onafhankelijke groepen te vergelijken, zoals bij het voorbeeld in de inleiding. In dit voorbeeld testen we de nulhypothese dat de gemiddelde bloeddruk van mensen die thee drinken even hoog is als mensen die geen thee drinken. Kies in SPSS: Analyze – Compare Means – Independent-Samples T Test.
 

T-test met afhankelijke steekproeven: paired samples t-test

Als je twee metingen hebt gedaan in dezelfde proefpersoon, spreek je van gepaarde metingen. Je meet bijvoorbeeld van 10 proefpersonen twee keer de bloeddruk op verschillende tijdstippen. In dit geval zijn de metingen niet onafhankelijk, en mag je de independent-sample t-test niet gebruiken. Gebruik in dat geval de gepaarde t-test (Analyze – Compare Means – Paired Samples T-Test). Check voordat je dit doet of het verschil tussen de metingen normaal verdeeld is! Gebruik in SPSS Transform – Compute Variable om het verschil tussen de twee metingen te berekenen.
 

Hoe interpreteer ik de output in SPSS?

Let er bij de output van de independent-sample t-test op dat Levene’s Test for Equality of Variances niet significant is. Als dat wel zo is, moet je de resultaten gebruiken naast “Equal variances not assumed” (de onderste rij). In de kolom Sig. (2-tailed), wordt de tweezijdige p-waarde gegeven. Verder geeft de output onder “Group Statistics” de gemiddelden en standaarddeviaties van de groepen.
 

Hoe rapporteer ik de uitkomsten van de t-test?

In je methode vermeld je bij het stuk over statistische analyse dat je voor het vergelijken van continue, normaal verdeelde variabelen de t-test hebt gebruikt. In je resultaten rapporteer je vervolgens de gemiddelden en standaarddeviaties van de groepen die je met elkaar hebt vergeleken. Zo weet de lezer hoe groot het verschil is. Vermeld ook de tweezijdige p-waarde.


28 maart 2020

Schakel de hulptroepen in!

Meld je nu aan voor een gratis uur scriptiebegeleiding of hulp met statistiek/SPSS.

Aanmelden