Wahrscheinlichkeitsverteilungen in R

Der Umgang mit Wahrscheinlichkeitsverteilungen ist eine grundlegende Fähigkeit bei statistischen Auswertungen oder Beratungen mit R. Die Programmiersprache R verfügt über eine Menge an Funktionen zum Rechnen mit Wahrscheinlichkeitsverteilungen, d.h. zur Berechnung von Dichten, Wahrscheinlichkeiten, Quantilen und zur Erzeugung von Zufallszahlen. Betrachten wir als Beispiel z.B. die Normalverteilung: 

  • Mit der Funktion dnorm werden Werte der Wahrscheinlichkeitsdichte berechnet. Möchte man z.B. die Wahrscheinlichkeitsdichte an der Stelle x=2 für eine standardnormalverteilte Zufallsvariable berechnen, lautet der Befehl dnorm(x=2). Weiterhin können auch andere Normalverteilungen als die Standardnormalverteilung untersucht werden. So erhält man die Wahrscheinlichkeitsdichte an der Stelle x=2 für eine Normalverteilung mit Erwartungswert 5 und Standardabweichung 3 mittels des Befehls dnorm(x=2,mean=5,sd=3).
  • Mit der R-Funktion pnorm lassen sich Werte der Verteilungsfunktion berechnen. Die Verteilungsfunktion an der Stelle x gibt hierbei die Wahrscheinlich an, dass eine Zufallsvariable einen Wert kleiner oder gleich x annimmt. Die Wahrscheinlichkeit, dass eine normalverteilte Zufallsvariable mit z.B. Erwartungswert 20 und Standardabweichung 0.5 einen Wert kleiner oder gleich 7 annimmt, lässt sich somit berechnen mittels des Befehls pnorm(x=7,mean=20,sd=0.5).
  • Quantile lassen sich mittels der Funktion qnorm berechnen. Ein Quantil ist diejenige Zahl, die die Werte einer Zufallsvariablen mit einer vorgegebenen Wahrscheinlichkeit nicht überschreiten. D.h., falls das 95%-Quantil der Verteilung einer Zufallsvariable z.B. bei 7 liegt, bedeutet dass, dass die Zufallsvariable mit 95-prozentiger Wahrscheinlichkeit einen Wert annimmt der kleiner als 7 ist. Mit R lässt sich z.B. das 95%-Quantil einer Normalverteilung mit Erwartungswert 2 und Standardabweichung 9 berechnen durch den Befehl qnorm(p=0.95,mean=2,sd=9).
  • Normalverteilte Zufallszahlen können in R mit dem Befehl rnorm erzeugt werden. Möchte man z.B. 150 Zufallszahlen aus einer Normalverteilung mit Erwartungswert 3 und Standardabweichung 0 erzeugen, so erhält man diese mit dem Befehl rnorm(n=150,mean=3,sd=0).

Analog zur Normalverteilung funktionieren die vorgestellten Befehle auch für andere Verteilungen. Es muss lediglich das Kürzel "norm" durch ein anderes Kürzel ersetzt werden welches für die jeweilige Verteilung typisch ist:

  • Für die t-Verteilung lauten die Befehle dt, pt, qt und rt, wobei bei der Eingabe des Befehls noch der gewünschte Freiheitsgrad anzugeben ist. Betrachten wir als Beispiel eine t-Verteilung mit 16 Freiheitsgraden. Die Dichte an der Stelle x=3 erhält man mit dt(x=3,df=16). Die Verteilungsfunktion an der Stelle x=3 wird berechnet mittels pt(x=3,df=16). Das 95%-Quantil wird berechnet mittels qt(p=0.95,df=16) und eine Stichprobe von 100 Zufallszahlen wird erzeugt mittels rt(n=100,df=16).

Neben Normal- und t-Verteilung sind noch zahlreiche weitere Verteilungen in R verfügbar. Unter folgendem Link erhalten Sie hierzu einen Überblick:

Übersicht Wahrscheinlichkeitsverteilungen in R.