Stata Nachhilfe: t-Test unabhängige Stichprobe

Hier erfahren Sie, wie man einen t-Test für unabhängige Stichproben in Stata berechnet. Wir verwenden als Beispiel wieder den Auto-Datensatz. Laden Sie den Datensatz, indem Sie in die Stata-Kommandozeile den Befehl

 

sysuse auto, clear

 

eingeben. Öffnen Sie nun den Dateneditor und sehen Sie sich den Datensatz an. Hierzu geben Sie den Befehl

 

edit

 

in die Kommandozeile ein. Der Dateneditor öffnet sich, und Sie können den Datensatz betrachten. Er sieht folgendermaßen aus (Klicken Sie auf die Graphik für eine Vergrößerung):

Stata Screenshot

Jede Zeile des Datensatzes steht für ein PKW-Modell. Der Name des Modells steht in der ersten Spalte mit Namen make.

Wir interessieren uns für 2 Variablen, nämlich für mpg und foreign. Die Variable mpg steht für "Miles per Gallon", bedeutet also wie effizient ein Wagen mit Kraftstoff umgeht. Die Variable foreign gibt an, ob das Auto inländisch oder ausländisch ist. Im Datensatz kennzeichnet "Domestic" ein inländisch und "Foreign" ein ausländisches Auto, wobei mit Inland die USA gemeint sind.

 

Wir möchten nun überprüfen, ob die mpg der inländischen Autos sich von der mpg der ausländischen Autos unterschiedet. Hierbei vermuten wir, dass die mpg der inländischen (=amerikanischen) Autos kleiner ausfallen wird, da amerikanische Autos häufig eher eine hohe Leistung bei großem Verbrauch aufweisen.

 

Die klassische Analysemethode zum Vergleich zweier Gruppen ist der t-Test für unabhängige Stichproben. Dieser setzt voraus, dass die untersuchte Variable (in unserem Fall mpg) in beiden Gruppen normalverteilt ist.

Wir berechnen daher zunächst einen Shapiro-Wilk-Test für die Variable mpg getrennt für beide Gruppen:

 

by foreign: swilk mpg

 

Wir erhalten sodann den folgenden Output: 

Stata Normalverteilung Test

Man erkennt: In der Gruppe der inländischen Autos ("Domestic") liegt der p-Wert des Shapiro-Wilk-Tests bei p=0.07, in der Gruppe der ausländischen Autos liegt er bei p=0.49. Da beide Werte über 0.05 liegen, kann man davon ausgehen dass in beiden Gruppen eine Normalverteilung vorliegt.

 

Wir führen nun also den t-Test durch und geben hierzu folgendes Kommando in Stata ein:

 

ttest mpg, by(foreign)

 

Es erscheint der folgende Output:

t Test unabhängige Stichproben Stata

Man erkennt, dass der p-Wert in der Mitte ganz unten den Wert p=0.0005 hat. Somit unterschieden sich das mpg der beiden Gruppen signifikant voneinander. 

Im oberen Teil des Stata-Outputs sieht man die Mittelwerte des mpg in den beiden Gruppen. Man erkennt, dass die Gruppe Domestic einen niedrigeren Mittelwert aufweist als die Gruppe Foreign. Das bedeutet, dass die amerikanischen Autos eine signifikant niedrigere Energieeffizienz aufweisen als die nicht-amerikanischen Autos.

 

Sie möchten weitere Artikel zum Thema Stata oder Statistik lesen? Hier geht es zurück zur Artikel-ÜbersichtFalls Sie sich für eine Stata-Nachhilfe oder eine Datenanalyse Beratung interessieren, nehmen Sie Kontakt uns auf und vereinbaren einen persönlichen Termin.