Pearson-Korrelationskoeffizient in SPSS berechnen (Pearson's r in SPSS)

Korrelationen sind eine grundlegende Methode zur Analyse von Zusammenhängen zwischen zwei Variablen. Die bekannteste Methode zur Korrelationsanalyse ist der Korrelationskoeffizient nach Pearson, der häufig auch als Pearson's r bezeichnet wird.

Wir erläutern Ihnen die Berechnung und Interpretation dieses Korrelationskoeffizienten in SPSS anhand eines Beispieldatensatzes. Der Datensatz ist in folgender Abbildung dargestellt:

 

 

Der Datensatz wurde an N=200 Personen erhoben. Er enthält neben der Personen-ID das Alter in Jahren (Age), das jährliche Einkommen (Age) und das Geschlecht (Sex). Nehmen wir nun an, Sie möchten untersuchen ob ein Zusammenhang zwischen Alter und dem Einkommen besteht. Eine mögliche Methode zur Analyse eines solchen Zusammenhanges ist die Korrelation nach Pearson. 

Der Korrelationskoeffizient nach Pearson setzt für beide untersuchten Variablen ein metrisches Messniveau vor. Da sowohl Alter als auch Einkommen metrische Variablen sind, ist die Pearson-Korrelation hier in diesem Beispiel geeignet.

 

Um den Korrelationskoeffizienten nach Pearson in SPSS zu berechnen, öffnen Sie das Menü Analysieren -> Korrelation -> Bivariat wie in folgender Abbildung dargestellt ist:

 

 

Es öffnet sich nun ein Menü. Wählen Sie in diesem Menü links die beiden Variablen aus, die Sie analysieren möchten, und fügen Sie die Variablen durch Klicken der Taste mit dem Pfeil in das rechte Feld mit der Überschrift Variablen ein. Drücken Sie dann unten auf OK:

 

 

Sie erhalten sodann im SPSS-Output-Fenster den Output der Pearson-Korrelation. Der Output sieht in unserem Beispiel folgendermaßen aus:

 

 

Der Output enthält 3 Kennzahlen, die von Interesse sind, nämlich den Korrelationskoeffizienten (Pearson Correlation), den p-Wert (Sig. (2-tailed)) und die Fallzahl (N). Betrachten wir zunächst den Korrelationskoeffizienten (Pearson Correlation). Dieser wird folgendermaßen interpretiert:

  • Der Korrelationskoeffizient (Pearson Correlation) gibt die Richtung und die Stärke des Zusammenhangs an. Wenn der Korrelationskoeffizient ein positives Vorzeichen hat, bedeutet dies dass zwischen den beiden variablen ein positiver Zusammenhang besteht, d.h. "je größer die eine Variable, desto größer auch die andere".
  • Wenn der Korrelationskoeffizient ein negatives Vorzeichen hat, bedeutet das dass zwischen den beiden Variablen ein negativer Zusammenhang besteht, also "Je größer die eine Variable, desto kleiner die andere".
  • Im allgemeinen gilt eine Korrelation als schwach, wenn Sie im Bereich -0.10 oder +0.10 liegt, als mittelstark wenn Sie im Bereich -0.3 oder 0.3 und als stark wenn Sie im Bereich -0.5 oder +0.5 liegt. Beachten Sie. Das Vorzeichen (also + oder -) spielt für die Stärke der Korrelation keine Rolle. Es kommt hier nur darauf an, dass die Korrelation umso stärker ist, je weiter der Wert von Null entfernt ist.
  • In unserem Beispiel liegt die Korrelation bei r=0.645. Somit liegt zwischen Alter und Einkommen eine starke, positive Korrelation vor.

Weiterhin muss die statistische Signifikanz (Sig. (2-tailed)) betrachtet werden. Die Signifikanz wird in der Literatur überwiegend als p-Wert bezeichnet, d.h. Signifikanz und p-Wert bedeuten das selbe:

  • Bei der Signifikanz müssen Sie vor allem darauf achten, ob der Wert kleiner oder größer als 0.05 ist. Wenn die Signifikanz kleiner als 0.05 ist, dann liegt eine statistisch signifikante Korrelation vor. Die im Output mit einem Stern (*) gekennzeichnet ist. 
  • Wenn die Signifikanz kleiner als 0.01 ist, spricht man von einer hochsignifikanten Korrelation, die mit zwei Sternen (**) gekennzeichnet wird.
  • Man erkennt, dass in unserem Beispiel die Signifikanz 0.00 beträgt, und die Korrelation somit hochsignifikant ist.

Schließlich ist im Output noch die Zahl enthalten. Dies ist die Anzahl an Fällen (D.h. Personen), die in die Korrelationsanalyse mit einbezogen wurden. Man erkennt somit, dass die obige Analyse an N=200 Personen durchgeführt wurde.

 

Beachten Sie noch die folgende Anmerkung zum Pearson-Korrelations-koeffizienten in SPSS: Wie bereits erwähnt, setzt die Methode ein metrisches Messniveau beider Variablen voraus. Weiterhin müssen beide Variablen normalverteilt sein. Beachten Sie jedoch, dass die Voraussetzung der Normalverteilung für Pearson's r nur bei kleinen Stichproben, d.h. bei N < 30 notwendig ist. Wenn Sie eine Stichprobe von N > 30 haben, ist die Normalverteilung keine Voraussetzung mehr, d. h. in diesem Fall dürfen Sie die Pearson-Korrelation mit SPSS auch dann berechnen, wenn keine Normalverteilung vorliegt. 

 

Kommentar schreiben

Kommentare: 2
  • #1

    Ewa Kaluza (Dienstag, 18 Dezember 2018 00:04)

    Die Erklärung gefällt mir sehr gut einfach erklärt, verständlich . Bei der Interpretation des T Test bitte korrigieren zwei Mal kommt das Wort grösser vor
    Wenn Werte grösser als 0,05 dann...……
    wenn Werte kleiner als 0,05, dann. Vielen Dank
    MFG

  • #2

    Klara Schmidt (Donnerstag, 28 März 2019 08:53)

    Hallo,

    woher beziehen Sie die Informationen, dass bei einer Stichprobe N > 30 die Pearson Korrelation robust genug gegen Verletzungen der Normalverteilung ist? Ich würde gern auf die Literaturquelle zurückgreifen.

    Danke LG