Survival-Analyse mit Stata

Stata bietet umfangreiche Funktionalität im Bereich Überlebenszeitanalyse und kommt daher oft bei einer Statistik-Beratung für medizinische Doktorarbeiten zum Einsatz. Für die Analyse wird ein Datensatz von Überlebenszeiten benötigt, der zumindest die folgenden Variablen enthalten sollte:

  • Die Überlebenszeit. Eine metrische Variable, die angibt wie lange ein Individuum als lebend beobachtet wurde.
  • Den Zensor. Eine binäre Variable die den Wert 0 annimmt, falls die zugehörige Überlebenszeit zensiert ist und 1 falls nicht.

Einen solchen Datensatz im Excel-Format können Sie hier herunterladen:

 

Download
Survival_Example.xlsx
Microsoft Excel Tabelle 3.5 KB

Nach Sie den Datensatz heruntergeladen haben, befindet er sich in Ihrem Downloads-Ordner. Lesen Sie nun den Datensatz in Stata ein. Nehmen wir an, das Verzeichnis des Downloads-Ordners auf Ihrem Rechner trägt die Bezeichnung C:\Users\Johnny\Downloads. In diesem Fall müssen Sie in die Stata-Kommandozeile den Befehl

 

import excel C:\Users\Johnny\Downloads\Survival_Example.xlsx, firstrow clear

 

eingeben. Die Daten befinden sich nun im Stata-Arbeitsspeicher. Sie können den Datensatz ansehen, indem Sie den Befehl edit eingeben.

Nun müssen die Daten als Survival-Daten festgelegt werden. In unserem Datensatz hat Überlebenszeit die Bezeichnung time und der Zensor die Bezeichung cens. Die Festlegung der Daten als Survival-Daten in Stata geschieht dann mittels des folgenden Befehls:

 

stset time, failure(cens)

 

Nach der Durchführung des stset-Befehls können spezielle Stata-Funktionen zur Überlebenszeitanalyse genutzt werden. So wird die Überlebenszeitanalyse häufig begonnen, indem eine Kaplan-Meier-Überlebenskurve erstellt wird. Dies wird mit dem folgenden einfachen Befehl bewerkstelligt:

 

sts graph

 

Das Resultat des Befehls ist eine klassische Survival-Kurve.

Des weiteren ist man innerhalb einer Survival-Analyse daran interessiert, die Effekte möglicher Risikofaktoren auf die Überlebensdauer zu untersuchen. Nehmen wir hierzu an, es liege im Datensatz noch eine weitere Variable vor:

  • Eine binäre Variable treat, die für jeden Probanden angibt ob er der Kontrollgruppe oder der Behandlungsgruppe unseres Experiments angehört mit treat=1 für die Behandlungsgruppe und treat = 2 für die Kontrollgruppe.

In einem solchen Setting interessiert man sich in erster Linie für den Effekt der Behandlung, d.h. ob die Behandlung einen Effekt auf das Überleben hat. Dies kann graphisch untersucht werden, indem eine Kaplan-Meier-Kurve getrennt für Kontroll- sowie Behandlungsgruppe erstellt wird, wozu der folgende Stata-Code verwendet wird:

 

sts graph, by(treat)

 

Nun kann anhand des graphischen Eindruckes entschieden werden, ob zwischen den beiden Gruppen ein Unterschied besteht. Man erkennt an dieser Graphik, dass die Gruppe 1 tendenziell eine längere Überlebensdauer aufweist als Gruppe 2.

 

 

Üblicherweise wird an diesem Punkt der Analyse zusätzlich ein Log-Rank-Test durchgeführt um zu untersuchen ob sich die Überlebenszeiten der beiden Gruppen signifikant unterscheiden. Hierzu wird in Stata der folgende Code eingegeben:

 

sts test treat

 

Sie erhalten nach Eingabe des Befehls den folgenden Output:

 

Der Output enthält als wichtigste Kennzahl den p-Wert des Log-Rank-Tests. Ist der p-Wert des Tests kleiner als 0.05, so besteht ein signifikanter Unterschied zwischen Kontrollgruppe und Behandlungsgruppe. Man erkennt, dass das hier nicht der Fall ist, es kann in diesem Beispiel also nicht nachgewiesen werden dass die beiden Treatments sich signifikant in Ihrer Wirkung unterscheiden.

 

 

Sie interessieren sich für weitere Informationen im Rahmen einer Stata-Nachhilfe oder Datenanalyse mit Stata? Nehmen Sie Kontakt auf!