In diesem Artikel lernen Sie, wie man mit Stata einen t-Test für verbundene Stichproben durchführt.
Wir stellen uns folgendes Szenario vor: 30 Versuchspersonen absolvieren einen Test zur Messung der Konzentrationsfähigkeit. Danach erhalten die Personen einen konzentrationsfördernden Energy-Drink und bearbeiten den Test noch einmal. Wir möchten überprüfen, ob sich durch den Konsum des Drinks eine Steigerung der Konzentrationsfähigkeit nachweisen lässt.
Da bei diesem Versuchsdesign zwei Variablen (Vorher und Nachher-Messung) verglichen werden, die an der selben Gruppe von Personen erfasst wurden, handelt es sich um verbundene Stichproben.
Laden Sie nun den folgenden Beispieldatensatz im Stata-Format .dta herunter:
Nach dem Herunterladen befindet sich der Datensatz in Ihrem Downloads Ordner. Öffnen Sie den Datensatz mit einem Doppelklick.
Sie haben den Datensatz nun in Stata eingelesen. Um sich den Datensatz anzusehen, geben Sie den folgenden Befehl ein:
edit
Mit diesem Befehl öffnen Sie die Stata-Datenansicht. Sie sehen nun den Datensatz, der folgendermaßen aussieht:
Der Datensatz enthält 3 Variablen: Die Personen-ID (id), die Punktzahl des ersten Tests ohne Energy-Drink (Score_t1) und die Punktzahl des zweiten Tests mit Energy-Drink (Score_t2).
Wir verwenden nun den t-Test für verbundene Stichproben um zu überprüfen, ob der Score des zweiten Zeitpunkts im Mittel höher ausfällt als des Score des ersten Zeitpunktes.
Der t-Test für verbundene Stichproben ist hierzu geeignet, da die beiden Scores ein metrisches Messniveau aufweisen und verbundene Stichproben sind.
Dieser Test hat eine Voraussetzung, nämlich dass die Differenz der Vorher- und Nachher-Werte normalverteilt ist. Um diese Voraussetzung zu prüfen, berechnen wir zunächst eine neue Variable "Diff", die die Differenz der beiden Messzeitpunkte enthält:
gen Diff = Score_t2 - Score_t1
Wir überprüfen nun mittels eines Shapiro-Wilk-Tests, ob die Variable Diff normalverteilt ist. Hierzu wird der folgende Stata-Code eingegeben:
swilk Diff
Man erhält sodann den folgenden Stata-Output:
Der Shapiro-Wilk Test ergibt rechts unten einen p-Wert von p=0.98. Da dieser Wert deutlich größer ist als 0.05, deutet der Test darauf hin dass die Differenzen normalverteilt sind. Somit ist diese Voraussetzung des t-Test erfüllt.
Wir berechnen nun den Test, und geben hierzu den folgenden Befehl ein:
ttest Score_t1 == Score_t2
Dies resultiert in folgendem Stata-Output:
Man erkennt im oberen Bereich des Outputs in der Spalte Mean, dass der Mittelwert der Scores in der ersten Messung 52.87 beträgt, in der zweiten Messung liegt er bei 57.13. Somit ist die Leistungsfähigkeit der Teilnehmer zum zweiten Zeitpunkt im Durchschnitt höher als zum ersten Zeitpunkt.
Der p-Wert des Tests ist ganz unten in der Mitte dargestellt. Der p-Wert ergibt sich zu p=0.0095. Da dieser Wert kleiner als 0.05 ist, liegt zwischen Zeitpunkt 1 und Zeitpunkt 2 ein signifikanter Unterschied vor. Die Leistungsfähigkeit hat sich somit durch den Konsum des Drinks signifikant erhöht.
Sie möchten weitere Artikel zum Thema Stata oder Statistik lesen? Hier geht es zurück zur Artikel-Übersicht. Informationen über unser Angebot der Stata-Nachhilfe finden Sie hier: Stata-Nachhilfe.