Überlebenszeitanalyse (2024)

Hintergrund: Zum Vergleich von zwei Therapien werden häufig Überlebenszeiten herangezogen. Diese sollten korrekt ausgewertet und interpretiert werden können.

Methoden: Anhand einer publizierten Studie zur Behandlung von Patienten mit Hirntumoren werden spezielle Verfahren zur Auswertung von Überlebenszeitdaten beschrieben. Diese Arbeit basiert auf ausgewählten Lehrbüchern der Statistik, einer selektiven Literaturauswahl und der eigenen Expertise.

Ergebnisse: Bei der Analyse von Überlebenszeitdaten wird das Kaplan-Meier-Verfahren benutzt. Es können Überlebensraten und die mediane Überlebenszeit angegeben werden. Mit Hilfe des Log-rank-Tests kann man die Überlebenszeiten von zwei Gruppen miteinander vergleichen. Für multivariable Modelle verwendet man die Cox-Regression. Das Hazard Ratio als deskriptives Maß für den Unterschied von Überlebenszeiten wird erläutert.

Schlussfolgerungen: Wenn nicht spezielle Verfahren bei der Analyse von Überlebenszeitdaten eingesetzt oder deren Annahmen nicht überprüft werden, können die Ergebnisse fehlerhaft sein. Der Leser einer wissenschaftlichen Publikation sollte diese Fallstricke kennen und beurteilen können, ob die gewählte Auswertestrategie korrekt ist.

Überlebenszeitanalyse (1)Überlebenszeitanalyse (2)

In vielen Bereichen der Medizin ist die primäre Zielgröße die Zeit bis zum Auftreten eines Ereignisses. Sie kann beispielsweise die Zeit von Lungenkrebsdiagnose bis zum Tod, die Zeit vom Einsetzen einer Zahnprothese bis zur ersten Reparatur oder die Zeit von Beginn einer Harninkontinenzbehandlung bis zum Therapieerfolg umfassen. Das „Ereignis“ kann sowohl ein Erfolg (Heilung) als auch ein Misserfolg (Tod) sein. Wichtig ist, dass sowohl der Startzeitpunkt als auch der Ereigniszeitpunkt klar definiert sind. Die Zeitspanne dazwischen wird allgemein als Überlebenszeit bezeichnet, selbst wenn das eintretende Ereignis nicht der Tod ist.

In fast allen medizinischen Fachzeitschriften findet man Artikel, in denen Techniken der Überlebenszeitanalyse benutzt werden. Ein erst kürzlich erschienenes Beispiel ist eine Studie über Patienten mit einem Hirntumor. Von Hoff et al. (1) untersuchten 280 Kinder und Jugendliche mit einem Medulloblastom aus der zweiarmigen, randomisierten HIT´91-Studie (HIT, Hirntumor). Patienten in Arm 1 erhielten eine Chemotherapie vor und nach der Bestrahlung (Sandwich-Chemotherapie), Patienten aus Arm 2 bekamen sofort eine Bestrahlung, gefolgt von einer Chemotherapie (Erhaltungschemotherapie). Es wurde überprüft, ob eine der zwei Therapien zu längeren Überlebenszeiten der Patienten führt.

Um die Ergebnisse und die Wertigkeit solcher Publikationen richtig interpretieren zu können, sollte der Leser mit den Verfahren der Überlebenszeitanalyse vertraut sein. Die vorliegende Arbeit führt anhand der HIT´91-Studie schrittweise in die Techniken der Überlebenszeitanalyse ein und versetzt den Leser in die Lage, diese selbst verstehen und interpretieren zu können.

Besonderheit von Überlebenszeitdaten

Klinische Studien sind sowohl aus ethischer als auch aus finanzieller Sicht zeitlich begrenzt. Das erwartete Ereignis, zum Beispiel Tod oder Therapieerfolg, tritt bei einigen Patienten erst nach Studienende oder auch gar nicht ein. Daher liegt für diese lediglich die Information vor, dass bis zu einem bestimmten Zeitpunkt noch kein Ereignis eingetreten ist. Diese Art von Beobachtung wird als Zensierung bezeichnet. Eine Zensierung kann auch auftreten, wenn Personen die Studie verlassen. Dies passiert zum Beispiel, wenn sie nicht weiter an der Studie teilnehmen möchten oder wenn sie aus Gründen, die nicht mit der Studie im Zusammenhang stehen, sterben.

In der Onkologie wird oft zwischen dem Gesamtüberleben (Zeit von der Diagnose bis zum Tod jedweder Art) und dem tumorspezifischem Überleben (Zeit von Diagnose bis zum Tod infolge des Tumors) unterschieden. Beim tumorspezifischen Überleben sind Patienten, die nicht aufgrund des Tumors sterben, zensiert, weil das Ereignis „Tod durch Tumor“ nicht eingetreten ist. In komplexeren Auswertungen können auch beide Ereignisse parallel untersucht werden (als konkurrierende Risiken). Darauf soll aber in dieser Arbeit nicht eingegangen werden. In der HIT´91-Studie wird die Zeit von primärer Operation des Hirntumors bis zum Tod jedweder Art betrachtet.

Neben den Daten von Patienten mit bekannter Überlebenszeit müssen auch die von zensierten Patienten in die Auswertung eingehen. Um die Daten der zensierten Patienten adäquat in die Analyse einfließen zu lassen, sind besondere Auswertungsstrategien notwendig.

Werden Überlebenszeitdaten nicht mit diesen Verfahren ausgewertet, sind die Ergebnisse im Allgemeinen fehlerbehaftet. Die häufigsten Fehler bei der Auswertung von Überlebenszeitdaten werden in Kasten 1 (gif ppt) vorgestellt.

Bei der Auswertung von Überlebenszeiten ist es wichtig, sowohl die Zeit bis zum Auftreten des Ereignisses als auch die Zensierungen zu berücksichtigen. Verfahren zur Auswertung und grafischen Darstellung von Überlebenszeitdaten werden im Folgenden anhand der HIT´91-Studie vorgestellt. Einfache Einführungen in die Überlebenszeitanalyse geben die Lehrbücher von Weiß (2) und von Schumacher und Schulgen (3). Zur weiterführenden Lektüre sei auf die Lehrbücher von Collett (4) oder Kalbfleisch und Prentice (5) verwiesen.

Kaplan-Meier-Kurve

Die Tabelle 1 in Kasten 2 (gif ppt) stellt die Überlebenszeiten von fünf Kindern mit einem Hirntumor dar. Die Wahrscheinlichkeit, dass ein Patient bis zu einem bestimmten Zeitpunkt überlebt hat, wird durch das Kaplan-Meier-Verfahren berechnet (6). Grafisch können die Überlebenszeiten mittels einer Kaplan-Meier-Kurve (auch Überlebenszeitkurve genannt) dargestellt werden (Grafik 1 in Kasten 2). Dazu trägt man auf der x-Achse die Überlebenszeit der Patienten und auf der y-Achse die mit dem Kaplan-Meier-Verfahren berechnete Überlebenswahrscheinlichkeit ab.

Die Berechnung der Überlebenswahrscheinlichkeiten und die grafische Darstellung durch die Kaplan-Meier-Kurve werden in Kasten 2 Schritt für Schritt erläutert.

Überlebensraten und mediane Überlebenszeit

Mit Hilfe der Kaplan-Meier-Kurve lassen sich Überlebensraten bestimmen. Überlebensraten geben an, bei wie vielen Patienten bis zu einem bestimmten Zeitpunkt noch kein Ereignis eingetreten ist. Im obigen Beispiel beträgt die 1-Jahres-Überlebensrate 30% (Kasten 2). Dies lässt sich folgendermaßen interpretieren: Ein Jahr nach Diagnose erwartet man, dass noch 30% der Patienten leben. Bei der Angabe von Überlebensraten ist es wichtig, den zugehörigen Zeitpunkt mit anzugeben. Zum Vergleich von zwei Therapiegruppen wird empfohlen die Kaplan-Meier-Kurven beider Therapiegruppen darzustellen, da diese mehr Information enthalten als die Angabe einzelner Überlebensraten.

Die mittlere Überlebenszeit hängt sehr stark vom Zensierungsmuster ab, so dass bei Überlebenszeiten immer der mediane Wert angegeben wird. Die mediane Überlebenszeit ist der Zeitpunkt, zu dem die Hälfte der Patienten ein Ereignis erlitten hat. Bei den fünf Hirntumorpatienten beträgt die mediane Überlebenszeit zehn Monate. Falls der Kaplan-Meier-Schätzer in der gesamten Beobachtungszeit über 50% liegt, ist die mediane Überlebenszeit nicht zu bestimmen. In diesem Fall ist bis zur maximalen Beobachtungszeit für weniger als die Hälfte der Patienten ein Ereignis eingetreten.

Log-rank-Test

In der HIT´91-Studie werden die Überlebenszeiten der Patienten aus den zwei Therapiegruppen getrennt für die einzelnen Metastasenstadien verglichen. Zum deskriptiven Vergleich der Überlebenszeiten der beiden Therapiegruppen innerhalb der Patienten mit Metastasenstatus M1 dienen die Kaplan-Meier-Kurven (Grafik 2). Um die Überlebenszeiten statistisch miteinander zu vergleichen, wird das Standardverfahren, der Log-rank-Test, angewendet. Der Log-rank-Test untersucht, ob die Überlebenszeiten in zwei Gruppen gleich lang sind. Hierzu wird nicht nur ein bestimmter Zeitpunkt, wie zum Beispiel die 6-Monats-Überlebensrate, betrachtet, sondern der gesamte Beobachtungszeitraum. Vereinfacht kann man sagen, dass die Kaplan-Meier-Kurven miteinander verglichen werden.

In einer erweiterten Form kann der Log-rank-Test auch für den Vergleich von drei oder mehr Gruppen genutzt werden, zum Beispiel für die Gegenüberstellung der Überlebenszeiten von Patienten mit Metastasenstatus M0 versus M1 versus M2/3. In diesem Fall wird untersucht, ob in mindestens einer der Gruppen eine längere oder kürzere Überlebenszeit besteht als in den anderen Gruppen.

In der HIT´91-Studie beträgt der p-Wert des Log-rank-Tests zum Vergleich der Therapiegruppen 0,020. Zum Signifikanzniveau α = 5% ist der Unterschied zwischen den Überlebenszeiten signifikant. Welche Gruppe die längeren Überlebenszeiten hat, kann man an der weiter oben liegenden Überlebenszeitkurve erkennen. Im vorliegenden Beispiel ist das die Gruppe mit Erhaltungschemotherapie. Patienten mit Erhaltungschemotherapie leben länger als Patienten mit Sandwich-Chemotherapie.

Hazard und Hazard Ratio

Kurzgefasst bezeichnet das Hazard die momentane Sterberate für eine Gruppe von Patienten. Das Hazard Ratio ist ein Quotient aus den Hazards von zwei Gruppen und gibt an, um wie viel die Sterberate in der einen Gruppe höher ist im Vergleich zu der Sterberate der anderen Gruppe. Das Hazard Ratio ist ein deskriptives Maß zum Vergleich von Überlebenszeiten zwischen zwei verschiedenen Gruppen von Patienten. Es ist wie ein relatives Risiko zu interpretieren (zum relativen Risiko: siehe Ressing et al. [7]) und wird in Kasten 3 (gif ppt) näher erläutert. Beträgt das Hazard Ratio 2,3 für Patienten mit Metastasen im Vergleich zu Patienten ohne Metastasen, so ist das Sterberisiko der Patienten mit Metastasen 2,3-mal so hoch wie das der Patienten ohne Metastasen (oder auch um 130% erhöht).

Cox-Regression

Im Folgenden soll der gleichzeitige Einfluss von mehreren Variablen auf die Überlebenszeit untersucht werden. Im Fokus stehen unter anderem:

  • Therapie
  • Geschlecht
  • Resektionsgrad
  • Metastasenstatus.

Außerdem soll der Einfluss der stetigen Variablen Alter bei Operation auf die Überlebenszeit betrachtet werden. In beiden Fällen eignet sich die Cox-Regression (8). Die Cox-Regression bietet außerdem die Möglichkeit, einen Schätzer für die Größe des Einflusses zu erhalten. Dieser Schätzer ist durch das Hazard Ratio gegeben.

Voraussetzungen

Die Cox-Regression setzt voraus, dass das Hazard Ratio über die Zeit konstant ist (deshalb auch „proportional hazards regression“ genannt). Das ist der Fall, sobald sich das Ereignisrisiko (Hazard) der Gruppe 2 proportional zu dem von Gruppe 1 verhält (Annahme von proportionalen Hazards). Zu jedem Zeitpunkt kann zwar das Ereignisrisiko (das Hazard) unterschiedlich sein, die Unterschiede über die Zeit sollen aber in beiden Gruppen über die Zeit gleich sein. Diese Annahme ist nicht immer gerechtfertigt, lässt sich aber anhand der Kaplan-Meier-Kurven in etwa beurteilen. Wenn eine gleichmäßige Überlegenheit einer der zwei Gruppen zu erkennen ist, kann von der Annahme der proportionalen Hazards ausgegangen werden. Anschaulich gesehen ist dies der Fall, wenn die Kaplan-Meier-Kurven sich nicht kreuzen. Falls die Kurven sich kreuzen sollten, ist dies nicht gegeben. Parmar und Machin (9) beschreiben, wie man die Annahme der proportionalen Hazards überprüft. Auch der Log-rank-Test setzt proportionale Hazards voraus.

Ein Beispiel für eine Situation, in der diese Annahme verletzt ist, ist folgendes: Die Überlebenszeiten von Patienten mit einer Operation sollen verglichen werden mit der von Patienten mit einer Radiotherapie anstelle der Operation. Das Risiko direkt nach der Operation zu sterben ist groß, danach sinkt das Risiko. Bei Patienten mit Radiotherapie ist das Risiko, direkt beim Beginn der Therapie zu sterben, niedrig, könnte sich aber im Laufe der Zeit erhöhen, falls die Radiotherapie nicht effektiv genug ist. Die zwei Sterberaten verhalten sich also nicht proportional zueinander.

Betrachtet man die Kaplan-Meier-Kurven der Patienten mit Metastasenstatus M1 aus der HIT´91-Studie (Grafik 2 gif ppt), ist zu erkennen, dass die Erhaltungschemotherapie gleichmäßig überlegen ist. Somit spricht nichts gegen die Annahme der proportionalen Hazards.

Ähnlich wie bei der linearen Regression sind auch bei der Cox-Regression verschiedene Prozeduren zur Variablenselektion möglich (siehe hierzu Schneider et al. [10]).

Cox-Regression am Beispiel

In der HIT´91-Studie zeigten drei Variablen einen Einfluss auf das Gesamtüberleben (Tabelle 2 gif ppt):

  • die Therapie (binär)
  • der Metastasenstatus bei Diagnose (kategorial)
  • das Alter bei Diagnose (stetig).

Die Referenzgruppe für die Variable Therapie ist durch die Patienten mit Erhaltungschemotherapie gegeben. Ein Hazard Ratio von 1,76 lässt sich folgendermaßen interpretieren: Kinder mit Sandwich-Chemotherapie haben ein 1,76-fach so hohes Risiko zu sterben im Vergleich zu Kindern mit Erhaltungschemotherapie.

Der Metastasenstatus hat vier Ausprägungen:

  • M0
  • M1
  • M2/3
  • „unbekannt“ (Patienten mit unbekanntem Status sind solche, bei denen nicht klar zwischen M0 und M1 unterschieden werden konnte).

Die Referenzgruppe, mit der verglichen wird, sind die Patienten mit Metastasenstatus M0. Das Sterberisiko innerhalb der drei Gruppen M1, M2/3 und „unbekannt“ wird jeweils mit dem der Referenzgruppe M0 verglichen. Demnach werden drei Hazard Ratios ausgegeben. Kinder mit M1 haben im Vergleich zu Kindern mit M0 ein 2,11-fach so hohes Risiko zu sterben (Hazard Ratio = 2,11), das Risiko ist demnach um 111% erhöht. Das Sterberisiko für Kinder mit M2/3 ist 3,06-mal so hoch wie das eines Kindes mit M0. Patienten mit unbekanntem Metastasenstatus haben ein 1,54-fach so hohes Risiko zu sterben im Vergleich zu Kindern mit M0. Neben dem Hazard Ratio ist auch das Konfidenzintervall zu beachten (11). Der Referenzwert ist hier die „1“ (= kein Effekt).

Bei einer stetigen Variable gibt das Hazard Ratio dieVeränderung des Sterberisikos an, falls sich die interessierende Variable um eine Einheit erhöht, der Patient also zum Beispiel bei Diagnose ein Jahr älter ist. Mit jedem Jahr, um das ein Patient bei Diagnose älter ist, ist sein Sterberisiko um 7% gesenkt (Hazard Ratio 0,93). Zu berücksichtigen ist, dass die gewählte Einheit der Einflussvariablen bei der Interpretation beibehalten wird (hier: Diagnosealter in Jahren, siehe Schneider et al. [10]).

Weitere wichtige Aspekte

Zeitabhängige Einflussgrößen

Bisher wurden nur Variablen betrachtet, die beim Startzeitpunkt der Überlebenszeit bekannt waren. So wurde in der HIT´91-Studie geprüft, ob Metastasen, die bei Operation des Hirntumors vorlagen, einen Einfluss auf das Überleben haben. Möchte man eine Variable untersuchen, die zum Startzeitpunkt noch unbekannt ist oder sich mit der Zeit verändert, sollte eine zeitabhängige Cox-Regression berechnet werden. Wenn man zum Beispiel wissen möchte, ob die kumulative Insulindosis bei Diabetespatienten die Zeitdauer bis zu einem kardiovaskulären Ereignis beeinflusst, darf man die kumulative Dosis nicht zum Startzeitpunkt als bekannt voraussetzen. Patienten, die länger überleben, haben im Allgemeinen eine höhere Gesamtdosis erhalten. Diese hohe kumulative Dosis hat aber nicht zum längeren Überleben geführt. Um diesen Effekt adäquat zu berücksichtigen, muss die kumulative Dosis zeitabhängig in die Cox-Regression eingehen. Eine zeitabhängige Cox-Regression durchzuführen ist sehr komplex und im Lehrbuch von Collett (4) ausführlich beschrieben.

Patienten unter Risiko

Als Patienten unter Risiko („patients at risk“) bezeichnet man die Patienten, die zu einem bestimmten Zeitpunkt noch leben. Oft wird die sich im Zeitverlauf ändernde Anzahl der Patienten unter Risiko in die Kaplan-Meier-Kurve integriert (unterhalb der Zeitachse). Da am rechten Rand der Kaplan-Meier-Kurve weniger Patienten unter Risiko sind (einige sind bereits gestorben oder zensiert), kann man mit dieser Information bestimmen, wie aussagekräftig die Kaplan-Meier-Schätzung am rechten Rand noch ist. Je weniger Patienten unter Risiko sind, desto größer wird das Konfidenzintervall des Kaplan-Meier-Schätzers.

Anzahl an Ereignissen

Um verlässliche Ergebnisse zu erzielen, muss eine angemessene Zahl an Ereignissen vorhanden sein (wichtig: hier ist nicht die Patientenzahl gemeint). Pro Variable, die in einer mulitvariablen Cox-Regression untersucht wird sollten mindestens zehn Ereignisse vorliegen (12). Bei wenigen Ereignissen können demnach nur wenige Einflussgrößen simultan untersucht werden. In der HIT´91-Studie wurden 101 Todesfälle beobachtet. Somit dürfen maximal zehn Variablen in die Cox-Regression aufgenommen werden.

Fallzahlplanung

Eine Fallzahlplanung ist sowohl für den Log-rank-Test als auch für die Cox-Regression möglich. Zusätzlich zum Signifikanzniveau und der Power, die erreicht werden soll, braucht man eine geschätzte Überlebensrate für jede Gruppe, die man vergleichen möchte beziehungsweise das geschätzte Hazard Ratio bei einer stetigen Einflussgröße (3). Bei der Fallzahlplanung werden auch die Rekrutierungs- und Follow-up-Zeit berücksichtigt.

Zensierungen

Falls die Verteilungen der zensierten Patienten in zwei zu vergleichenden Therapiegruppen unterschiedlich sind, kann ein Bias in der Auswertung entstehen. Aus diesem Grunde sollte die Vollständigkeit des Follow-ups innerhalb der Therapiegruppen berichtet werden, (siehe hierzu Clark et al. [13]).

Resümee

Da Überlebenszeitdaten Zensierungen beinhalten, müssen diese immer mit dem Kaplan-Meier-Verfahren und dem Log-rank-Test ausgewertet werden. Eine Analyse anhand der Häufigkeiten der Ereignisse führt oft zu fehlerhaften Ergebnissen. Jeder Arzt sollte Kaplan-Meier-Kurven, den Log-rank-Test und Ergebnisse der Cox-Regression verstehen, weil er in der Lage sein muss, diese dem Patienten zu erklären (zum Beispiel bei der Wahl der Therapie: Hirntumorbehandlung mit Sandwich- oder Erhaltungschemotherapie).

Multivariable Analysen können mit der Cox-Regression durchgeführt werden. Anhand der Hazard Ratios mit Konfidenzintervallen kann man die Ergebnisse interpretieren. Leider werden die Voraussetzungen für die Cox-Regression nicht immer beachtet (zum Beispiel „proportional hazards“, zeitabhängige Variablen), deshalb sind viele publizierte Analysen oft fehlerbehaftet. Es ist wichtig, dass der Leser einer wissenschaftlichen Publikation diese Fallstricke kennt und beurteilen kann, ob die gewählte Auswertestrategie korrekt ist.

Interessenkonflikt

Die Autoren erklären, dass kein Interessenkonflikt im Sinne der Richtlinien des International Committee of Medical Journal Editors besteht.

Manuskriptdaten
eingereicht: 1. 6. 2010, revidierte Fassung angenommen: 12. 10. 2010

Anschrift für die Verfasser
Prof. Dr. rer. nat. Maria Blettner
Institut für Medizinische Biometrie (IMBEI)
Johannes Gutenberg-Universität
Obere Zahlbacher Straße 69
55131 Mainz

Summary

Survival Analysis—Part 15 of a Series on Evaluation of Scientific Publications

Background: Survival times are often used to compare treatments. Survival data are a special type of data, and therefore have to be analyzed with special methods.

Methods: We illustrate special techniques for analyzing survival times by applying them to a publication on the treatment of patients with brain tumors. The present article is based on textbooks of statistics, a selective review of the literature, and the authors’ own experience.

Results: Survival times are analyzed with the Kaplan-Meier method, which yields two measures of interest: survival rates and the median survival time. The log-rank test is used to compare survival times across treatment groups. Cox regression is used in multivariable models. The hazard ratio, a descriptive measure for differences in survival times, is explained.

Conclusion: If survival times are analyzed without the use of special techniques, or if the underlying assumptions are not taken into account, faulty interpretation may result. Readers of scientific publications should know these pitfalls and be able to judge for themselves whether the chosen analytical method is correct.

Zitierweise
Zwiener I, Blettner M, Hommel G: Survival analysis—part 15 of a series on evaluation of scientific publications. Dtsch Arztebl Int 2011; 108(10): 163–9. DOI:10.3238/arztebl.2011.0163

@The English version of this article is available online:
www.aerzteblatt-international.de

Überlebenszeitanalyse (2024)
Top Articles
Latest Posts
Recommended Articles
Article information

Author: Rev. Leonie Wyman

Last Updated:

Views: 5263

Rating: 4.9 / 5 (59 voted)

Reviews: 82% of readers found this page helpful

Author information

Name: Rev. Leonie Wyman

Birthday: 1993-07-01

Address: Suite 763 6272 Lang Bypass, New Xochitlport, VT 72704-3308

Phone: +22014484519944

Job: Banking Officer

Hobby: Sailing, Gaming, Basketball, Calligraphy, Mycology, Astronomy, Juggling

Introduction: My name is Rev. Leonie Wyman, I am a colorful, tasty, splendid, fair, witty, gorgeous, splendid person who loves writing and wants to share my knowledge and understanding with you.