Chi-Quadrat-Test in R berechnen

In diesem Artikel finden Sie eine Anleitung zur Durchführung des Chi-Quadrat-Unabhängigkeitstests in R. Mit diesem Test wird überprüft, ob ein Zusammenhang zwischen zwei kategoriellen Variablen besteht. Der Test ist eine sehr grundlegende Methode und daher oft Gegenstand der statistischen Beratung.

 

Nehmen wir also an, wir untersuchen die beiden Variablen "Geschlecht" und "Parteipräferenz" und möchten sehen ob ein es einen Zusammenhang zwischen diesen zwei Variablen gibt. Da beide Variablen kategoriell sind, ist der Chi-Quadrat-Test geeignet.

 

Wir haben nun je 50 Männer und Frauen befragt, welche der 3 Parteien CDU, SPD und Grüne am meisten ihrer politischen Präferenz entspricht. Das Ergebnis der Befragung haben wir in in einen Datensatz im txt-Format eingetragen. Sie können den Datensatz hier herunterladen:

Download
Geschlecht_Parteien.txt
Text Dokument 1.7 KB

Nach dem Herunterladen befindet sich der Datensatz in Ihrem Downloads Ordner. Um den Datensatz einzulesen, geben Sie folgenden Code in R ein:

 

data <- read.table("C:/Users/Jakob/Downloads/Geschlecht_Parteien.txt")

 

Ersetzen Sie hierbei den Nutzernamen "Jakob" durch den Nutzernamen den Sie auf Ihrem Rechner verwenden. Sie haben den Datensatz nun eingelesen. Um den Datensatz in R anzusehen, geben Sie den folgenden Befehl ein: 

 

head(data,10)

 

Mit diesem Befehl wird angefordert, dass R die ersten 10 Zeilen des Datensatzes anzeigt. Bei Eingabe des Befehls erscheint im R-Fenster folgender Output:

R Datensatz anzeigen

Man erkennt, dass der Datensatz 2 Variablen enthält, nämlich die bevorzugte Partei mit den Ausprägungen SPD, CDU und Gruene und das Geschlecht mit den Ausprägungen M und W.

Wir erstellen nun zunächst eine Kreuztabelle der beiden Variablen Geschlecht und Partei. Hierzu verwenden wir den folgenden Befehl:

 

table(data$Geschlecht, data$Partei)

 

Der Befehl bewirkt im R-Output-Fenster das folgende Ergebnis:

R Statistik Kreuztabelle

In der Kreuztabelle ist ersichtlich, dass 23 Männer sich für die CDU entschieden haben, aber nur 11 Frauen. Ebenso sieht man, dass die SPD von Frauen bevorzugt wird: 25 Frauen gegenüber 15 Männern bevorzugen diese Partei. Dieses Ergebnis deutet also darauf hin, dass ein Zusammenhang zwischen Geschlecht und Parteipräferenz besteht.

Um zu untersuchen, ob der Zusammenhang statistisch signifikant ist, wenden wir den Chi-Quadrat-Test an. Hierzu geben wir den folgenden Befehl ein:

 

chisq.test(table(data$Geschlecht, data$Partei))

 

Dies resultiert in folgendem R-Output:

R Chi Quadrat Test

Der Output enthält als wichtigste Kennzahl rechts unten den p-Wert bzw. p-Value. Dieser beträgt 0.032 und ist damit kleiner als 0.05. Somit haben wir nachgewiesen, dass zwischen Geschlecht und Parteipräferenz ein statistisch signifikanter Zusammenhang besteht.

 

Sie möchten weitere Artikel zum Thema R oder Statistik lesen? Hier geht es zurück zur R-Artikel-Übersicht.