Die Kaplan-Meier-Kurve wird häufig verwendet, um Daten über die Zeit bis zum Eintritt eines bestimmten Ereignisses zu analysieren, z. B. die Zeit bis zum Tod. Dabei stellt die Kaplan-Meier-Kurve die Überlebensrate oder Überlebensfunktion grafisch dar. Die Zeit wird auf der x-Achse und die Überlebensrate auf der y-Achse aufgetragen.
Überlebensrate
Zunächst stellt sich die Frage, was die Überlebensrate ist. Schauen wir uns das an einem Beispiel an. Nehmen wir an, du bist Zahntechnikerin und möchtest die „Überlebenszeit“ einer Füllung im Zahn untersuchen.
Dein Startzeitpunkt ist also jener Moment, in dem eine Person beim Zahnarzt eine Füllung bekommt und der Endzeitpunkt, also das Event, ist der Moment, wenn diese Füllung herausbricht. Die Zeit zwischen diesen beiden Ereignissen steht im Fokus deiner Studie.
In der Kaplan Meier Kurve kannst du nun ablesen, wie wahrscheinlich es ist, dass eine Füllung länger als bis zu einem gewissen Zeitpunkt hält.
Die horizontale Achse stellt also die Zeit dar, die oft in Monaten oder Jahren gemessen wird. Die vertikale Achse stellt die geschätzte Wahrscheinlichkeit dar.
In diesem Zusammenhang könnte dich zum Beispiel interessieren, wie wahrscheinlich es ist, dass deine Füllung länger als 5 Jahre hält. Hierfür liest du in der Grafik beim Wert 5 Jahren ab, wie hoch die Überlebensrate ist. Bei 5 Jahren gibt dir die Kaplan Meier Kurve ein Wert von 0,7. Es ist also zu 70% wahrscheinlich, dass eine Füllung länger als 5 Jahre hält.
Interpretation der Kaplan-Meier-Kurve
Die Kaplan-Meier-Kurve zeigt die kumulativen Überlebenswahrscheinlichkeiten an.
Eine steilere Steigung deutet auf eine höhere Ereignisrate (Sterberate) und damit auf eine schlechtere Überlebensprognose hin. Eine flachere Steigung deutet auf eine niedrigere Ereignisrate und damit auf eine bessere Überlebensprognose hin. Die Kurve kann Plateaus oder flache Bereiche aufweisen, die auf Perioden mit relativ stabilem Überleben hinweisen.
Wenn es mehrere Kurven für verschiedene Gruppen gibt, kannst du ihre Formen und Muster vergleichen. Wenn die Kurven parallel verlaufen, deutet das darauf hin, dass die Gruppen ähnliche Überlebenserfahrungen gemacht haben. Wenn die Kurven auseinanderlaufen oder sich kreuzen, deutet das auf Unterschiede im Überleben der Gruppen hin.
Zu bestimmten Zeitpunkten kannst du die Überlebenswahrscheinlichkeit schätzen, indem du den Zeitpunkt auf der horizontalen Achse festlegst und eine vertikale Linie an die Kurve anlegst. Lies dann die entsprechende Überlebenswahrscheinlichkeit auf der vertikalen Achse ab.
Kaplan-Meier-Kurve berechnen
Damit du eine Kaplan-Meier-Kurve erstellen kannst, benötigst du zunächst die Daten deiner Probanden. Nehmen wir an, beim ersten Probanden hat die Füllung 3 Jahre gehalten, bei der zweiten Probandin 4 Jahre beim dritten Probanden auch vier Jahre und so weiter und so fort.
Gehen wir zunächst davon aus, dass keiner der Fälle "zensiert" ist. Die Daten sind schon so angeordnet, dass die kleinste Überlebenszeit ganz oben steht und die größte ganz unten.
Wir erstellen nun eine zweite Tabelle, mit deren Hilfe wir die Kaplan-Meier-Kurve zeichnen können. Dazu schauen wir, welche Zeiten in der linken Tabelle vorkommen und fügen den Zeitpunkt Null hinzu. Wir haben also 0, dann 3, 4, 6, 7, 8 11 und 13. Insgesamt haben wir 10 Probanden.
Wir untersuchen nun, wie viele Füllungen zu welchem Zeitpunkt ausbrechen. Dies tragen wir in die Spalte m ein. Zum Zeitpunkt 0 sind keine Füllungen ausgebrochen. Nach 3 Jahren ist eine Füllung ausgebrochen, nach 4 Jahren sind zwei Füllungen ausgebrochen, nach 6 Jahren ist eine Füllung ausgebrochen. Dies wird nun für alle anderen Zeitpunkte wiederholt.
Als nächstes betrachten wir die Anzahl der Fälle, die bis zu diesem Zeitpunkt überlebt haben, plus die Fälle, bei denen das Ereignis genau zu diesem Zeitpunkt eintritt. Dies wird in Spalte n eingetragen.
n gibt somit die Anzahl der Fälle an, die bis zu diesem Zeitpunkt überlebt haben, zuzüglich der Personen, die genau zu diesem Zeitpunkt ausgeschieden sind.
Nach 0 Jahren haben wir noch alle 10 Personen. Nach 3 Jahren erhalten wir für n 10, bei 9 Personen ist die Füllung noch heil und bei einer Person ist die Füllung genau nach 3 Jahren ausgebrochen.
Der einfachste Weg an n zu kommen ist, den vorherigen n Wert minus dem vorherigen m Wert zu berechnen. Also erhalten wir 10 – 1 ist gleich 9. Dann 9 minus 2 ist gleich 7, 7 - 1 ist gleich 6… und so weiter und so fort.
Aus der Spalte n können wir uns nun die Überlebensraten ausrechnen. Hierfür teilen wir einfach den Wert n durch die Gesamtanzahl also 10.
Damit erhalten wir 10 durch 10 ist gleich 1, 9 durch 10 ist gleich 0,9, 7 durch 10 ist gleich 0,7. Das machen wir nun auch für alle anderen.
Kaplan Meier Kurve zeichnen
Nun können wir die Kaplan Meier Kurve zeichnen. Zum Zeitpunkt 0 haben wir einen Wert von 1, nach 3 Jahren haben wir einen Wert von 0,9 bzw. 90 Prozent. Nach 4 Jahren erhalten wir 0,7 nach 6 Jahren 0,6 und so weiter und so fort.
Damit können wir nun in der Kaplan Meier Kurve ablesen, wieviel Prozent der Füllung nach einer gewissen Zeit noch nicht ausgebrochen sind.
Zensierte Daten
Als Nächstes sehen wir uns an, was zu tun ist, wenn zensierte Daten vorliegen. Hierfür wurden an diesen drei Stellen beispielhaft zensierte Daten ergänzt. Wenn du nicht genau weißt, was zensierte Daten sind, schaue dir gerne das allgemeine Tutorial zur Überlebenszeitanalyse an.
Diese Daten müssen wir nun in unsere Tabelle für die Kaplan Meier Kurve einarbeiten. So gehen wir dabei vor: Unser m erstellen wir genau gleich wie vorher, wir schauen, wie viele Fälle zu der jeweiligen Zeit versagt haben.
Nun ergänzen wir noch die Spalte q, in die Spalte q tragen wir ein, wie viele Fälle zu dem jeweiligen Zeitpunkt zensiert wurden.
Hierbei ist zu beachten, dass der Zeitpunkt, wo der jeweilige zensierte Fall aufgetreten ist, keine eigene Reihe bekommt, sondern dem vorherigen Zeitpunkt zugeordnet wird.
Schauen wir uns das an diesem Fall an. Die Zensierung hat zum Zeitpunkt 9 stattgefunden. In dieser Tabelle gibt es aber keinen Zeitpunkt mit neun Jahren und er wird auch nicht hin zu geführt. Die jeweilige Person wird bei dem Zeitpunkt 8 ergänzt.
Jetzt können wir wieder die Werte für die Überlebenszeit-Kurve ausrechnen. Wenn zensierte Daten vorliegen, ist dies ein wenig aufwendiger.
Hierfür schreiben wir uns im ersten Schritt erst mal die Werte auf. Diese Werte erhalten wir, indem wir n-m/n rechnen. In der dritten Reihe zum Beispiel erhalten wir mit 12-2 durch 12 den Wert 10/12.
Die Berechnung des eigentlichen Wertes geschieht nun iterativ. Hierfür multiplizieren wir jeweils das Ergebnis aus der vorherigen Reihe mit dem eben berechneten Wert.
Also, in der ersten Reihe erhalten wir 1, nun rechnen wir 12/13 mal 1, was gleich 0,923 ist. In der nächsten Reihe rechnen wir dann 10/12 mal 0,923 und erhalten einen Wert von 0,769. Diesen Wert nehmen wir dann wieder für die nächste Reihe her.
Das machen wir nun für alle Reihen. Anschließend können wir auf dem gleichen Weg wie vorher mit diesen Daten die Kaplan Meier Kurve zeichnen.
Vergleich zwischen verschiedenen Gruppen
Wenn du mehrere Gruppen oder Kategorien (z. B. Behandlungsgruppen) vergleichst, besteht die Kaplan-Meier-Kurve aus mehreren Linien, die jeweils eine andere Gruppe darstellen. Jede Linie zeigt die geschätzte Überlebensrate für die jeweilige Gruppe an. Um zu prüfen, ob es einen statistisch signifikanten Unterschied zwischen den Gruppen gibt, kann der Log-Rank-Test verwendet werden.
Wenn du mehrere Faktoren hast und sehen willst, ob sie sich auf die Kurve auswirken, kannst du einen Log Rank Test oder eine Cox-Regression hier auf DATAtab berechnen.
Voraussetzungen für die Kaplan-Meier-Kurve
Zufällige Zensierung: Diese Annahme besagt, dass das Auftreten von Zensierungen in keinem Zusammenhang mit der Wahrscheinlichkeit steht, das betreffende Ereignis zu erleben. Mit anderen Worten: Die Zensierung sollte zufällig sein und nicht von Faktoren beeinflusst werden, die das Ergebnis des Ereignisses beeinflussen. Wenn die Zensierung nicht informativ ist, können die geschätzten Überlebenswahrscheinlichkeiten verzerrt sein.
Unabhängigkeit der Zensierung: Bei dieser Annahme wird davon ausgegangen, dass die Zensurzeitpunkte verschiedener Personen unabhängig voneinander sind. Das bedeutet, dass das Auftreten oder der Zeitpunkt der Zensierung eines Teilnehmers keinen Aufschluss über die Zensurzeitpunkte der anderen Teilnehmer geben sollte.
Die Überlebenswahrscheinlichkeiten ändern sich im Laufe der Zeit nicht: Die Kaplan-Meier-Kurve geht davon aus, dass die zu jedem Zeitpunkt geschätzten Überlebenswahrscheinlichkeiten im Laufe der Zeit konstant bleiben. Diese Annahme ist möglicherweise nicht gültig, wenn es zeitlich veränderliche Faktoren oder Behandlungen gibt, die die Überlebenswahrscheinlichkeit beeinflussen können.
Keine konkurrierenden Risiken: Die Kaplan-Meier-Kurve geht davon aus, dass das interessierende Ereignis das einzig mögliche Ergebnis ist und es keine anderen konkurrierenden Ereignisse gibt, die das Eintreten des untersuchten Ereignisses verhindern könnten. Konkurrierende Ereignisse können andere Todesursachen oder Ereignisse sein, die das Eintreten des interessierenden Ereignisses unmöglich machen.
Kaplan Meier Kurve mit DATAtab erstellen
Beispieldaten ladenUm die Kaplan Meier Kurve mit DATAtab zu erstellen, gehst du einfach auf den Statistik Rechner auf datatab.de und kopierst deine eigenen Daten in die Tabelle.
Nun klickst du auf "Plus" und wählst Survival Analysis aus. Hier kannst du die Kaplan Meier Kurve online erstellen. Wenn du nun die Variable "Zeit" auswählst erstellt dir DATAtab die Kaplan Meier Kurve und du bekommst die Survival Tabelle ausgegeben. Wenn du keinen Status anklickst, geht Datatab davon aus, dass die Daten nicht zensiert sind. Ist dies nicht der Fall, klicke auch noch die Variable an, die die Informationen enthält, welcher Fall zensiert ist und welcher nicht. Eins steht für Event eingetreten und 0 steht für zensiert. Nun bekommst du hierfür die passenden Ergebnisse.