x

¿Aún no esta registrado?

Crea tu cuenta. Registrate en Elsevier y obtendrás:

Registrarme ahora
España | Cambiar
Ayuda - - Regístrese - Teléfono 902 888 740
Buscar en

Indexada en:

Index Medicus/Medline, Latindex, IBECS, IME, SCOPUS y MEDES

Índice SCImago

SCImago Journal & Country Rank

Análisis del tiempo hasta un evento (supervivencia)

Time to event (survival) analysis

V Abraira a

a Unidad de Bioestadística Clínica. Hospital Ramón y Cajal. Madrid.

Palabras Clave

análisis supervivencia, datos censurados, Kaplan-Meier.

Keywords

survival analysis, censored, Kaplan-Meier.

Resumen

La principal dificultad en el estudio de la variable "tiempo hasta que se produce un evento" es que al final del período de seguimiento frecuentemente hay individuos en los que no se ha podido observar el evento y en los que, por tanto, el tiempo hasta su ocurrencia es desconocido. A este fenómeno se le denomina censura. Se denomina análisis de supervivencia al conjunto de técnicas que permiten estudiar la variable tiempo hasta que ocurre un evento y su dependencia de otras posibles variables explicativas teniendo en cuenta la información parcial contenida en las censuras. Estas técnicas asumen que las censuras no son informativas y que todos los factores implicados en el estudio son homogéneos a lo largo del período de seguimiento.

Artículo

Con frecuencia en los estudios médicos, la principal variable de interés es el tiempo hasta que ocurre un evento. Este evento puede ser adverso como muerte, ocurrencia de un infarto o recidiva de un cáncer, o positivo como curación, normalización de la concentración de colesterol o reincorporación a la vida laboral después de una enfermedad. El diseño de los estudios para evaluar la variable "tiempo hasta la ocurrencia de un evento" consiste en seguir en el tiempo a un grupo de pacientes, desde un momento inicial tal como el diagnóstico o el inicio del tratamiento o la aleatorización en un ensayo clínico, hasta un tiempo final en el que acaba la recogida de datos. En cuanto al análisis, a pesar de que la variable tiempo hasta un evento es continua, su análisis suele presentar dos dificultades que impiden realizarlo con las técnicas estadísticas generales para las variables continuas, tales como la "t" de Student, el análisis de la varianza, o los modelos de regresión lineal. En primer lugar, en la mayor parte de los estudios, la variable tiempo no tiene la distribución normal que esas técnicas exigen, más bien suele tener una distribución asimétrica, en la que típicamente los eventos ocurren con mayor frecuencia al principio que al final del período de seguimiento y en segundo lugar y más importante, en general, al final del período de seguimiento siempre hay individuos en los que no se ha podido observar el evento y, por tanto, en los que el tiempo hasta su ocurrencia es desconocido, si bien se tiene una información parcial sobre él, es mayor o igual que el tiempo observado. A este fenómeno se le denomina censura y es el que exige un planteamiento específico para estas variables, que permita aprovechar la información contenida en los tiempos censurados.

Al conjunto de técnicas que permiten estudiar la variable tiempo hasta que ocurre un evento y su dependencia de otras posibles variables explicativas se le denomina análisis de supervivencia y aunque este nombre sugiere que el evento es muerte, se insiste en que también puede y debe usarse para analizar el tiempo hasta cualquier otro evento como, por ejemplo, curación, aparición de la enfermedad, o rechazo de un injerto. En otros ámbitos como procesos de control de calidad se estudia con las mismas técnicas el tiempo hasta que un cierto producto falla (tiempo de fallo), o el tiempo de espera hasta recibir un servicio (tiempo de espera), etc.

Existen tres motivos por los que pueden aparecer las censuras: en primer lugar por fin del estudio. Supóngase, por ejemplo, que para evaluar la eficacia de un nuevo tratamiento para una enfermedad mortal se sigue en el tiempo, durante un año, a dos grupos de pacientes. A los pacientes de un grupo se les administró el tratamiento en evaluación y a los del otro el tratamiento estándar, y se registró la duración del intervalo de tiempo entre el inicio del tratamiento y la muerte. Al final del estudio puede haber individuos que no hayan muerto. La segunda causa es la pérdida del seguimiento, en el ejemplo anterior algunos de los individuos pueden desaparecer del estudio en algún momento del mismo por diversos motivos: cambio de domicilio, falta de interés, etc. Una última causa de censura es la ocurrencia de un evento competitivo que impida la observación del evento, por ejemplo, muerte por alguna otra causa ajena al estudio. Es ésta la causa de censura a la que hay que prestar más atención en el diseño de los estudios, como se comentará más adelante. Todos estos tiempos censurados infraestiman el tiempo hasta el evento, que siempre ocurrirá, asumiendo que ocurra, en un tiempo posterior.

Hay que tener en cuenta también que la variable es el tiempo hasta que ocurre el evento, y está definida por la duración del intervalo temporal entre los instantes en que empieza la observación y ocurre el evento. En general, la observación no comienza en el mismo instantes para todos los individuos, y la manera habitual de registrar los tiempos en la clínica es mediante las fechas de ocurrencia, por tanto, antes del análisis hay que convertir el "tiempo de calendario" a "tiempo hasta el evento". En el esquema de la figura 1 se detalla este proceso y los posibles mecanismos de censura. Es importante fijarse en el paciente E que muere por accidente de tráfico, y que suele plantear un problema en el diseño de estos estudios; hay autores que prefieren definir el evento de interés como muerte por una causa relacionada con la enfermedad en estudio y, por tanto, censurarían las muertes por causas no relacionadas, argumentando, con cierto sentido, que una muerte por accidente de tráfico no debería "contar" si lo que se está evaluando es, por ejemplo, la supervivencia a un cáncer, mientras que otros prefieren definirlo como muerte por todas las causas. A favor de esta última opción está la dificultad que suele tener la clasificación de una muerte como relacionada, o no, con la enfermedad en estudio y su tratamiento y, por tanto, la potencial inclusión de sesgos por mala clasificación. En general, cuando el evento de interés es la muerte, ésta por todas las causas se considera un evento más robusto que la muerte por causas específicas1 y es por ello el preferido, aunque otras veces se realizan los análisis para las dos definiciones del evento. Sin embargo, si el evento de interés fuera la reincorporación a la vida laboral después de una depresión, la muerte por accidente de tráfico de un paciente de baja sí sería considerada una censura.

Figura 1. Esquema temporal de un estudio para observar tiempos de espera para un evento, por ejemplo, supervivencia tras un diagnóstico de cáncer. El estudio empezó el 1 de enero de 1990 y acabó el 1 de enero de 2002. En A el eje temporal representa años de calendario y en B años desde el diagnóstico. Con el círculo en blanco se representan los tiempos censurados y con el cuadrado negro las muertes (ocurrencia del evento). El individuo A al que se le diagnosticó en enero de 1990, desaparece del estudio en enero de 1993 (sería una censura a los 3 años por pérdida de seguimiento). El B, también diagnosticado en enero de 1990, fallece en junio de 1992 (muerte a los 2,5 años). El C sigue vivo al acabar el estudio (sería un dato censurado a los 12 años por fin del estudio). El D, al que se le diagnostica en febrero de 1991, fallece en marzo de 1999, el tiempo de supervivencia sería de 8 años. El E, que fue diagnosticado en noviembre de 1993, fallece en accidente de tráfico en julio de 1997 (sería una muerte, o un dato censurado, a los 3,7 dependiendo de la definición de evento de interés ­véase texto­). El F, al que se le diagnosticó al principio de 1996, sigue vivo al acabar el estudio, sería un dato censurado a los 6 años por fin del estudio.

 

La descripción de la variable tiempo hasta que ocurre el evento se suele realizar mediante la denominada función de supervivencia S(t), que da, para cada tiempo t, la probabilidad de que, en un individuo de la cohorte, el evento ocurra (sobreviva, si el evento es muerte) en un tiempo igual o mayor que t. Esta función se estima por el método de Kaplan-Meier que tiene en cuenta la información contenida en las censuras. El método estima la probabilidad de supervivencia, en cada tiempo en que ocurren eventos, multiplicando la probabilidad de llegar "vivo" a este tiempo por la probabilidad de no morir en ese tiempo2. La figura 2 muestra la función de supervivencia a la bacteriemia, estimada con un seguimiento de 21 días, entre todos los pacientes a los que se les diagnosticó entre enero de 1991 y diciembre de 1994 en el hospital Xeral de Lugo3. En ella se observa, por ejemplo, S(1) aproximadamente igual a 0,95 y S(14) aproximadamente igual a 0,85, es decir, la probabilidad de sobrevivir 1 día, o más, es 0,95 y la probabilidad de sobrevivir 14 días, o más, es 0,85. En este estudio, el evento fue la muerte relacionada con la sepsis y aquellos pacientes cuya muerte fue por causa claramente no relacionada con ella fueron excluidos del estudio, y los que sobrevivieron más de 21 días fueron censurados.

Figura 2. Función de supervivencia a la bacteriemia, con un seguimiento de 21 días, entre todos los pacientes diagnosticados entre enero de 1991 y diciembre de 1994 en el hospital Xeral de Lugo.

 

Para comparar las curvas de supervivencia de dos o más grupos de pacientes, la prueba más usada es la denominada prueba del "log-rank" y consiste en calcular, en cada tiempo y para cada grupo, el número de eventos que se esperarían encontrar si no hubiera diferencia entre las funciones de supervivencia de los grupos, para construir un estadístico con la suma de las diferencias entre eventos observados y esperados, al cuadrado, divididas por los esperados, a partir del cual se calcula el valor p correspondiente a la comparación de las curvas de supervivencia de los grupos. En la figura 3 se muestran, como ejemplo, las curvas correspondientes a los pacientes que presentaron shock séptico y los que no lo presentaron en el estudio del hospital Xeral; para ellas el log-rank es 330,1 al que le corresponde p = 0,0000, es decir con la convención habitual4 la diferencia en la supervivencia de ambos grupos es estadísticamente significativa.

Figura 3. Funciones de supervivencia a la bacteriemia de los pacientes que presentaron shock séptico (curva de abajo) y los que no lo presentaban (curva de arriba).

 

Además de este método univariante, existen otros que permiten estudiar el efecto de diversas variables simultáneamente, entre ellos los modelos de regresión de Cox y los modelos paramétricos2,5, pero su descripción excede del objetivo de esta nota.

Todos estos métodos, que permiten tratar las observaciones censuradas, sólo son válidos si las censuras no son informativas en términos pronósticos o, dicho con otras palabras, si los individuos censurados tienen la misma probabilidad de tener un evento después de la censura que aquellos que siguen en el estudio. Como justamente de los individuos perdidos no se tienen datos, esta asunción no es fácil de verificar, pero se incumpliría si, por ejemplo, en un estudio se produjesen más pérdidas entre los pacientes con peor pronóstico, por ejemplo, si los pacientes que sufrieran la toxicidad de los tratamientos, o un empeoramiento de alguna condición clínica fueran por ello los más propensos a abandonar el estudio. Otra asunción de estos métodos es la homogeneidad de todos los factores a lo largo del período de seguimiento, por tanto, hay que prestar atención a los cambios en los medios diagnósticos y terapéuticos que se pueden producir en el tiempo que dure el estudio y que pueden atentar a esta asunción haciendo que los pacientes reclutados en diferentes momentos tengan diferente pronóstico.

Bibliografía

1. Clark TG, Bradburn MJ, Love SB, Altman DG. Survival analysis part I: basic concepts and first analyses. Br J Cancer 2003;89:232-8.
Medline
2. Abraira Santos V, Pérez de Vargas A. Métodos multivariantes en Bioestadística. Madrid: Centro de Estudios Ramón Areces, 1996.
3. Casariego E, Abraira V, Corredoira JC, Alonso García MP, Rodríguez Feijoo A, López Álvarez MJ, et al. A predictive model for mortality of bloodstream infections. Bedside analysis with the Weibull function. J Clin Epidemiol 2002;55:563-72.
Medline
4. Abraira V. Contrastes de hipótesis: el valor p. SEMERGEN 2002; 28:374-5.
5. Bradburn MJ, Clark TG, Love SB, Altman DG. Survival analysis part II: multivariate data analysis an introduction to concepts and methods. Br J Cancer 2003;89:431-6.
Medline