Boxplots sind eine weit verbreitete Art von statistischen Graphiken und finden in zahlreichen Datenanalysen Anwendung. Wir demonstrieren Ihnen die Erstellung von Boxplots in Stata anhand eines Beispieldatensatzes. Um den Datensatz zu laden, geben Sie das folgende Kommando in die Stata-Kommandozeile ein:
sysuse bpwide, clear
Sehen sie sich den Datensatz nun an, indem Sie den Befehl edit eingeben. Der Datensatz enthält die Variablen sex (Geschlecht), agegrp (Altersgruppe) sowie zwei Blutdruckmessungen: bp_before (Blutdruck vor der Therapie) und bp_after (Blutdruck nach der Therapie).
Wir erstellen zunächst einen einfachen Boxplot der Variablen bp_before und bp_after mit folgendem Befehl:
graph box bp_before bp_after
Der so erstellte Plot erlaubt uns einen graphischen Vergleich von Vorher- und Nachhermessung und sieht folgendermaßen aus:
Es ist sichtbar, dass der Boxplot der Nachher-Messung niedriger als als bei der vorher-Messung. Somit scheint die Behandlung, die zwischen den beiden Messungen statt fand einen blutdrucksenkenden Effekt zu haben.
Lassen Sie uns nun noch untersuchen, ob Unterschiede zwischen den Altersgruppen und den Geschlechtern bestehen. Solche Gruppenvergleiche mittels Boxplots sind in der statistischen Beratung sehr gängig und werden häufig vorgenommen.
Wir betrachten zunächst Altersunterschiede. Hierzu erstellen wir gruppierte Boxplots und verwenden als Gruppierungsvariable die Variable agegrp. Das Schaubild wird erstellt mittels des Befehls:
graph box bp_before bp_after, over(agegrp)
Durch die Option over(agegrp) wird die Gruppierung der Boxplots nach der Variable agegrp angefordert. Sehen wir uns das erzeugte Schaubild nun an:
Sie erkennen, dass das Schaubild sehr gut strukturiert ist. Es erlaubt uns, Unterschiede zwischen den Gruppen zu ermitteln und wir erkennen, dass der Blutdruck umso höher ist, je älter die Personen sind. In jeder der Gruppen ist jedoch die Nachher-Messung niedriger als die Vorher-Messung, was bedeutet dass die blutdrucksenkende Therapie in allen Altersgruppen Wirkung zeigt.
Weiterhin ist es möglich die Boxplots auch nach mehr als einer Variablen zu gruppieren.
Wir wählen nun als weitere Gruppierungsvariable das Geschlecht. Der zugehörige Stata-Befehl lautet folgendermaßen:
graph box bp_before bp_after, over(agegrp) over(sex)
Das resultierende Schaubild hat die folgende Gestalt:
Mit diesem Schaubild ist es nun möglich, ebenfalls Unterschiede zwischen den Geschlechtern zu untersuchen. Man erkennt, dass Frauen (in der rechten Hälfte des Schaubilds sichtbar) tendenziell einen niedrigeren Blutdruck aufweisen als Männer.