R Grundlagen

Betrachten Sie das nachfolgende Beispiel einer kleinen Analyse mit R. Nehmen wir an, es liegen zwei Varianten eines Produktes vor. Es soll nun untersucht werden, welche Variante des Produktes die größere Akzeptanz bei den Kunden besitzt. Hierzu werden 20 Versuchspersonen rekrutiert und in zwei Gruppen aufgeteilt. Jede der beiden Gruppen von Versuchspersonen erhält eine Variante des Produkts, dessen Attraktivität sie auf einer Skala von 0 bis 10 angeben sollen. Aus der Kundenbefragung resultieren die folgenden Punktzahlen:

 

Produktvariante A: 5, 4, 5, 5, 4, 6, 4, 3, 5, 4

Produktvariante B: 5, 3, 9, 7, 3, 7, 8, 9, 8, 5

 

Diese Daten werden nun folgendermaßen in R eingegeben:

 

A <- c(5, 4 ,5, 5, 4, 6, 4, 3, 5, 4)

B <- c(5, 3, 9, 7, 3, 7, 8, 9, 8, 5)

 

Nach der Eingabe dieser Befehle liegen die Daten in R vor und können für weitere Analysen verwendet werden. Um einen Überblick über die Daten zu bekommen, wird zunächst ein einfacher Boxplot der beiden Datenreihen erstellt. Hierzu wird der folgende R-Befehl verwendet:

 

boxplot(A,B,ylab="Kundenbewertung",names=c("A","B"),

col=c("tomato","cyan"),boxwex=0.5)

 

Als Argumente des Befehls boxplot() wurden zunächst die Datenreihen A und B angegeben. Das Argument ylab="Kundenbewertung"  bewirkt, dass die y-Achse des Schaubilds mit der Beschriftung Kundenbewertung versehen wird. Durch das Argument names=c("A","B") werden die Boxplots mit A bzw. B beschriftet, die Option col=c("tomato","cyan") verleiht den Boxplots ihre Farbe und mit dem Argument boxwex=0.5 wird die Breite der Boxen kontrolliert. Das Ergebnis der Eingabe ist die folgende Abbildung:

Boxplot mit R - Statistik Beratung

Man erkennt, dass der Boxplot für Gruppe A deutlich niedriger liegt als für Gruppe A, was vermuten lässt dass Produkt B von den Kunden besser bewertet wird als Produkt A. Um diese Vermutung zu untermauern, vergleichen wir die beiden Gruppen in R mittels eines t-Tests für unabhängige Stichproben. Hierzu verwenden wir den folgenden R-Code:

 

t.test(A,B,paired=FALSE)

 

Als Argumente des Befehls t.test werden A und B, d.h. die zuvor definierten Daten eingegeben. Des weiteren wird mittels der Option paired=FALSE festgelegt, dass es sich bei den Daten um unabhängige Stichproben handelt.

Als Ergebnis erhält man folgenden R-Output:

 

data:  A and B

t = -2.4783, df = 11.473, p-value = 0.02986

alternative hypothesis: true difference in means is not equal to 0

95 percent confidence interval:

-3.5789726   -0.2210274

sample estimates:

mean of x  mean of y 

 

4.5                6.4 

 

Dieser Output enthält in der 2. Zeile als wichtigste Kennzahl den p-Wert des Tests. Dieser beträgt 0.02986 und ist damit kleiner als 0.05 (das allgemein übliche Konfidenzniveau). Somit liegt zwischen den beiden Varianten des Produktes ein signifikanter Unterschied in der Akzeptanz durch die Kunden vor.