Dieser Artikel enthält eine Einführung in die Erstellung von Balkendiagrammen mit R. Wir haben hierzu je 50 Männer und Frauen danach befragt, welche der 3 Parteien CDU, SPD und Grüne am meisten ihrer politischen Präferenz entspricht. Das Ergebnis der Befragung haben wir in in einen Datensatz im txt-Format eingetragen. Sie können den Datensatz hier herunterladen:
Nach dem Herunterladen befindet sich der Datensatz in Ihrem Downloads-Ordner. Um den Datensatz einzulesen, geben Sie folgenden Code in R ein:
data <- read.table("C:/Users/Jakob/Downloads/Geschlecht_Parteien.txt")
Ersetzen Sie hierbei den Nutzernamen "Jakob" durch den Nutzernamen den Sie auf Ihrem Rechner verwenden. Sie haben den Datensatz nun eingelesen. Wir möchten nun die Parteipräferenz untersuchen und erstellen dazu ein Balkendiagramm der absoluten Häufigkeiten. Hierzu geben wir folgenden Befehl in R ein:
barplot(table(data$Partei))
Das Ergebnis der Eingabe ist das folgende Schaubild:
Man erkennt, dass die Sympathisanten der SPD in unserem Datensatz die Mehrheit ausmachen, gefolgt von CDU und Grünen.
Dieses Diagramm erfüllt zwar seinen Zweck, aber es wirkt etwas farblos. Wir nutzen daher einige der zahlreichen Graphik-Optionen, um das Schaubild ein wenig zu verbessern. Dazu geben wir den folgenden Code in R ein:
barplot(table(data$Partei),col=c("black","green","red"),
ylab="Anzahl Personen")
Der Parameter col=c("black","green","red") bewirkt die Farbgebung des Schaubilds und der Parameter ylab="Anzahl Personen" die Beschriftung der y-Achse. Als Ergebnis erhalten wir folgendes Schaubild:
Nun möchten wir noch anhand eines weiteren Balkendiagrammes untersuchen, ob sich die Parteipräferenz von Männern und Frauen unterscheidet. Hierzu erstellen wir ein gruppiertes Balkendiagramm, wozu wir folgendes Kommando in R eingeben:
barplot(table(data$Geschlecht,data$Partei),beside=T,
col=c("deepskyblue","tomato"),ylab="Anzahl Personen")
legend("top",fill=c("deepskyblue","tomato"),legend=c("M","W"),horiz=T)
Erläuterung zu den Befehlen:
Der erste Teil bewirkt dass das Schaubild erstellt wird. Hierzu wenden wir zunächst die Funktion table() auf die Variablen Geschlecht und Partei des Datensatzes data an und berechnen so eine Kreuztabelle von Geschlecht und Partei. Auf die so entstandene Tabelle wird daraufhin der Befehl barplot() angewandt, was bewirkt dass für jede Zelle der Kreuztabelle ein Balken erstellt wird.
Der zweite Befehl legend() dient dazu, die Legende in das Diagramm zu platzieren. Die Farbe und Beschriftung der Legende wird hier ebenfalls festgelegt.
Wir erhalten dadurch die folgende Graphik:
In dieser Graphik ist nun deutlich zu erkennen, dass die CDU eher von Männern, die SPD eher von Frauen und die Grünen in etwa gleichermaßen von beiden Geschlechtern präferiert werden.
Sie möchten weitere Artikel zum Thema Statistik mit R lesen? Hier geht es zurück zur Übersicht des R-Tutorials.
Falls Sie sich für eine Statistik-Beratung oder Nachhilfe zum Thema R interessieren, werfen Sie einen Blick auf unser R-Nachhilfe-Angebot.