Chi-Quadrat-Test in R berechnen

In diesem Artikel finden Sie eine Anleitung zur Durchführung des Chi-Quadrat-Unabhängigkeitstests in R. Mit diesem Test wird überprüft, ob ein Zusammenhang zwischen zwei kategoriellen Variablen besteht. Der Test ist eine sehr grundlegende Methode und daher oft Gegenstand der statistischen Beratung.

 

Video-Tutorial: Chi²-Test in R berechnen

Um die Anwendung des Chi-Quadrat-Tests in R zu erlernen, sehen Sie sich das folgende Youtube-Tutorial an:

 

 

War das Video hilfreich für Sie? Falls ja, klicken Sie den Like-Button und abonnieren Sie unseren YouTube-Kanal. Die Inhalte des Kanals werden regelmäßig erweitert.

 

Schriftliche Anleitung Chi²-Test in R

Falls Sie keine Videos mögen, finden Sie alternativ im folgenden eine schriftliche Anleitung zum Chi-Test in R. 

 

Nehmen wir in diesem Beispiel an, wir untersuchen die beiden Variablen "Geschlecht" und "Parteipräferenz" und möchten sehen ob ein es einen Zusammenhang zwischen diesen zwei Variablen gibt. Da beide Variablen kategoriell sind, ist der Chi-Quadrat-Test geeignet.

 

Wir haben nun je 50 Männer und Frauen befragt, welche der 3 Parteien CDU, SPD und Grüne am meisten ihrer politischen Präferenz entspricht. Das Ergebnis der Befragung haben wir in in einen Datensatz im RData-Format eingetragen. Sie können den Datensatz hier herunterladen:

 

Download
data.RData
GNU komprimierte Datei 488 Bytes

 

 

Nach dem Herunterladen befindet sich die Datei in Ihrem Downloads-Ordner. Klicken Sie mit einem Doppelklick auf die Datei, um sie zu öffnen.

 

Sie haben den Datensatz nun in R eingelesen. Um den Datensatz in R anzusehen, geben Sie den folgenden Befehl ein: 

 

head(data,10)

 

Mit diesem Befehl wird angefordert, dass R die ersten 10 Zeilen des Datensatzes anzeigt. Bei Eingabe des Befehls erscheint im R-Fenster folgender Output:

R Datensatz anzeigen

Man erkennt, dass der Datensatz 2 Variablen enthält, nämlich die bevorzugte Partei mit den Ausprägungen SPD, CDU und Gruene und das Geschlecht mit den Ausprägungen M und W.

 

Wir erstellen nun zunächst eine Kreuztabelle der beiden Variablen Geschlecht und Partei. Hierzu verwenden wir den folgenden Befehl:

 

table(data$Geschlecht, data$Partei)

 

Der Befehl bewirkt im R-Output-Fenster das folgende Ergebnis:

R Statistik Kreuztabelle

In der Kreuztabelle ist ersichtlich, dass 23 Männer sich für die CDU entschieden haben, aber nur 11 Frauen. Ebenso sieht man, dass die SPD von Frauen bevorzugt wird: 25 Frauen gegenüber 15 Männern bevorzugen diese Partei. Dieses Ergebnis deutet also darauf hin, dass ein Zusammenhang zwischen Geschlecht und Parteipräferenz besteht.

Um zu untersuchen, ob der Zusammenhang statistisch signifikant ist, wenden wir den Chi-Quadrat-Test an. Hierzu geben wir den folgenden Befehl ein:

 

chisq.test(table(data$Geschlecht, data$Partei))

 

Dies resultiert in folgendem R-Output:

R Chi Quadrat Test

Der Output enthält als wichtigste Kennzahl rechts unten den p-Wert bzw. p-Value. Dieser beträgt 0.032 und ist damit kleiner als 0.05. Somit haben wir nachgewiesen, dass zwischen Geschlecht und Parteipräferenz ein statistisch signifikanter Zusammenhang besteht.

 

Sie möchten weitere Artikel zum Thema R oder Statistik lesen? Hier geht es zurück zur R-Artikel-Übersicht.