Stata-Beratung: t-Test

In diesem Artikel lernen Sie, wie man mit Stata einen t-Test für verbundene Stichproben durchführt.

Wir stellen uns folgendes Szenario vor: 30 Versuchspersonen absolvieren einen Test zur Messung der Konzentrationsfähigkeit. Danach erhalten die Personen einen konzentrationsfördernden Energy-Drink und bearbeiten den Test noch einmal. Wir möchten überprüfen, ob sich durch den Konsum des Drinks eine Steigerung der Konzentrationsfähigkeit nachweisen lässt.

 

Da bei diesem Versuchsdesign zwei Variablen (Vorher und Nachher-Messung) verglichen werden, die an der selben Gruppe von Personen erfasst wurden, handelt es sich um verbundene Stichproben, wir analysieren daher mit dem t-Test für verbundene Stichproben.

 

Laden Sie nun den folgenden Beispieldatensatz im Excel-Format herunter:

Download
Ttest_example.xlsx
Microsoft Excel Tabelle 2.8 KB

Nach dem Herunterladen befindet sich der Datensatz in Ihrem Downloads Ordner. Um den Datensatz einzulesen, geben Sie folgenden Code in die Stata-Kommandozeile ein:

 

import excel using "C:\Users\Jakob\Downloads\Ttest_example.xlsx", firstrow 

 

Ersetzen Sie hierbei den Nutzernamen "Jakob" durch den Nutzernamen den Sie auf Ihrem Rechner verwenden. Sie haben den Datensatz nun eingelesen. Um sich den Datensatz anzusehen, geben Sie den folgenden Befehl ein: 

 

edit

 

Mit diesem Befehl öffnen Sie die Stata-Datenansicht. Sie sehen nun den Datensatz, der folgendermaßen aussieht:

Stata Datensatz einlesen

Der Datensatz enthält 3 Variablen: Die Personen-ID (id), die Punktzahl des ersten Tests ohne Energy-Drink (Score_t1) und die Punktzahl des zweiten Tests mit Energy-Drink (Score_t2).

Wir verwenden nun den t-Test für verbundene Stichproben um zu überprüfen, ob der Score des zweiten Zeitpunkts im Mittel höher ausfällt als des Score des ersten Zeitpunktes.

Dieser Test hat eine Voraussetzung, nämlich dass die Differenz der Vorher- und Nachher-Werte normalverteilt ist. Um diese Voraussetzung zu prüfen, berechnen wir zunächst eine neue Variable "Diff", die die Differenz der beiden Messzeitpunkte enthält:

 

gen Diff = Score_t2 - Score_t1

 

Wir überprüfen nun mittels eines Shapiro-Wilk-Tests, ob die Variable Diff normalverteilt ist. Hierzu wird der folgende Stata-Code eingegeben:

 

swilk Diff

 

Man erhält sodann den folgenden Stata-Output:

Stata Shapiro Wilk Test

 

Der Shapiro-Wilk Test ergibt rechts unten einen p-Wert von p=0.98. Da dieser Wert deutlich größer ist als 0.05, deutet der Test darauf hin dass die Differenzen normalverteilt sind. Somit ist diese Voraussetzung des t-Test erfüllt.

Wir berechnen nun den Test, und geben hierzu den folgenden Befehl ein:

 

ttest Score_t1 == Score_t2

 

Dies resultiert in folgendem Stata-Output:

t Test verbundene Stichproben Stata

Man erkennt in der obersten Zeile des Outputs, dass der Mittelwert der Scores in der ersten Messung 52.87 beträgt, in der zweiten Messung liegt er bei 57.13.

 

Sie möchten weitere Artikel zum Thema Stata oder Statistik lesen? Hier geht es zurück zur Artikel-Übersicht.

Informationen über unser Angebot der Stata-Nachhilfe finden Sie hier: Stata-Nachhilfe