Boxplots mit Stata erstellen

Boxplots sind eine weit verbreitete Art von statistischen Graphiken und finden in zahlreichen Datenanalysen Anwendung. Wir demonstrieren Ihnen die Erstellung von Boxplots in Stata anhand eines Beispieldatensatzes. Um den Datensatz zu laden, geben Sie das folgende Kommando in die Stata-Kommandozeile ein:

 

sysuse bpwide, clear

 

Sehen sie sich den Datensatz nun an, indem Sie den Befehl edit eingeben. Der Datensatz enthält die Variablen sex (Geschlecht), agegrp (Altersgruppe) sowie zwei Blutdruckmessungen: bp_before (Blutdruck vor der Therapie) und bp_after (Blutdruck nach der Therapie). 

 

Einfache Boxplots

Wir erstellen zunächst einen einfachen Boxplot der Variablen bp_before und bp_after  mit folgendem Befehl:

 

graph box bp_before bp_after

 

Der so erstellte Plot erlaubt uns einen graphischen Vergleich von Vorher- und Nachhermessung und sieht folgendermaßen aus:

Boxplot mit Stata erstellen

Es ist sichtbar, dass der Boxplot der Nachher-Messung niedriger als als bei der vorher-Messung. Somit scheint die Behandlung, die zwischen den beiden Messungen statt fand einen blutdrucksenkenden Effekt zu haben.

Lassen Sie uns nun noch untersuchen, ob Unterschiede zwischen den Altersgruppen und den Geschlechtern bestehen. Solche Gruppenvergleiche mittels Boxplots sind in der statistischen Beratung sehr gängig und werden häufig vorgenommen.

 

Gruppierte Boxplots mit Stata

Wir betrachten zunächst Altersunterschiede. Hierzu erstellen wir gruppierte Boxplots und verwenden als Gruppierungsvariable die Variable agegrp. Das Schaubild wird erstellt mittels des Befehls:

 

graph box bp_before bp_after, over(agegrp)

 

Durch die Option over(agegrp) wird die Gruppierung der Boxplots nach der Variable agegrp angefordert. Sehen wir uns das erzeugte Schaubild nun an:

Statistische Beratung erstellt Boxplots mit Stata, R und SPSS

Sie erkennen, dass das Schaubild sehr gut strukturiert ist. Es erlaubt uns, Unterschiede zwischen den Gruppen zu ermitteln und wir erkennen, dass der Blutdruck umso höher ist, je älter die Personen sind. In jeder der Gruppen ist jedoch die Nachher-Messung niedriger als die Vorher-Messung, was bedeutet dass die blutdrucksenkende Therapie in allen Altersgruppen Wirkung zeigt.

Weiterhin ist es möglich die Boxplots auch nach mehr als einer Variablen zu gruppieren.

 

Mehrfach gruppierte Boxplots

Wir wählen nun als weitere Gruppierungsvariable das Geschlecht. Der zugehörige Stata-Befehl lautet folgendermaßen:

 

graph box bp_before bp_after, over(agegrp) over(sex)

 

Das resultierende Schaubild hat die folgende Gestalt:

Mit diesem Schaubild ist es nun möglich, ebenfalls Unterschiede zwischen den Geschlechtern zu untersuchen. Man erkennt, dass Frauen (in der rechten Hälfte des Schaubilds sichtbar) tendenziell einen niedrigeren Blutdruck aufweisen als Männer.