¿Qué es un análisis de supervivencia?

Artículo nº176 de Suis

Los análisis de supervivencia son muy útiles para analizar datos de ensayos clínicos y nutricionales veterinarios. Este tipo de análisis son un conjunto de procedimientos estadísticos que tienen en cuenta la variable tiempo, lo que les da una serie de propiedades que nos permiten analizar variables a lo largo del tiempo. Son importantes porque tal vez en otro análisis que no considerase la variable tiempo no seríamos capaces de detectar ciertas diferencias entre variables que sí detectamos con estas técnicas. Pero, ¿Qué quiere decir esto realmente?

Comencemos por definir los términos tiempo y evento.

  • Con tiempo nos referimos a años, meses, semanas, días, … desde que comienza el seguimiento de un individuo (origen) hasta que ocurre el evento.

  • Por evento, nos referimos al suceso que le ocurre a un individuo, como puede ser la muerte o la aparición, recaída o recuperación de una enfermedad. A estos eventos generalmente se les denomina “fallo” porque suelen tener connotaciones negativas (muerte), aunque no siempre es así (podría determinarse como evento la recuperación de una enfermedad).

Por ejemplo, en pruebas con nuevos tratamientos como podría ser una vacuna, puede ser de interés estudiar el tiempo que esta tarda en hacer efecto.

En estos análisis tendremos que considerar otra variable conocida como censura. Esta recoge la información de si un individuo tiene datos censurados o no. Existen varios tipos de censura, pero de momento sólo vamos a referirnos a censura por la derecha. Estos datos censurados son datos sobre individuos de los que se tiene información, pero no se conoce el tiempo exacto de supervivencia por alguna de estas 3 posibles razones:

  • El individuo no ha experimentado el evento fijado durante el tiempo de estudio.

  • Se ha perdido el seguimiento de dicho individuo.

  • El individuo ha sido retirado por muerte u otra razón.

Siguiendo con el ejemplo de la vacuna, imaginemos que es una prueba para cerdos y el evento fijado fuese el contagio por una enfermedad infecciosa en cuestión, podría darse el caso de tener un grupo de cerdos dentro de nuestro estudio que no se contagiase por la enfermedad durante el tiempo que durase el estudio. Sin embargo, no podríamos saber si estos cerdos se van a contagiar después de este periodo o no.

Terminología y notación utilizada en los Análisis de Supervivencia

  • Se define como T la variable aleatoria tiempo de supervivencia para un individuo. Se define como t cualquier valor aleatorio específico que pueda tomar T. Y como d= (0 , 1) la variable aleatoria que indica si se trata de datos censurados (1) o no (0).

  • Por otro lado, existen dos funciones cuantitativas que describen cualquier análisis de supervivencia: S(t) – función de supervivencia – y h(t) – función de riesgo instantáneo.

No vamos a entrar en cuestiones algebraicas, pero si es importante destacar que, aunque estas funciones sean conceptualmente opuestas, siendo que S(t) representa la probabilidad de supervivencia en un tiempo t y h(t) la tasa de fallo (muerte, recaída, etc) entre los individuos que continúan “vivos” en un tiempo concreto t, entre ambas funciones existe la siguiente relación matemática:

Por lo tanto, cuando h(t) es constante, la función S(t) es exponencial.

Ejemplo práctico con RCommander

Una vez que ya hemos introducido brevemente los conceptos teóricos sobre este tipo de análisis, pasaremos a explicar cómo podríamos proceder ante un estudio de estas características con R-Commander.

Abrimos RCommander:

library(Rcmdr)

Instalamos el paquete RcmdrPlugin.survival y las librerías que se utilizarán en nuestro análisis (introduciendo el código de la siguiente imagen).

Después, debemos ir a Herramientas>Cargar Plugin(s) de Rcmdr, donde seleccionaremos RcmdrPlugin.survial según se muestra en la imagen:

Siguiendo con lo mencionado, trabajaremos con una base de datos adaptada y simplificada para este ejemplo, con información sobre el tiempo que tardaron 2 grupos de pollos (1; control negativo o placebo y 2; animales vacunados) en infectarse. Podría utilizarse cualquier base de datos siempre que nuestros datos tengan la estructura correcta:

  • Cada fila de datos corresponda a un individuo.
  • Las variables categóricas se deben codificar con números enteros.
  • Presenten, mínimo, la variable tiempo de supervivencia (t) y la variable indicadora de supervivencia o no supervivencia (d(0 , 1)).

El archivo de la base de datos con la que realizaremos la práctica se encuentra disponible de manera totalmente gratuita en nuestro Drive y que podrás descargarte haciendo clic aquí.

Importamos los datos siguiendo la siguiente ruta: Datos/Importar datos/Desde un archivo excel

Este conjunto de datos cuenta con el identificador del animal (idAnimal) y 3 variables: time (tiempo hasta la infección en días), delta (indicador supervivencia o muerte, 0 o 1 respectivamente), group (grupo de estudio al que pertenece cada animal) y tratamiento (placebo o vacuna).

Una vez hemos cargado las herramientas necesarias para este tipo de análisis y nuestros datos de interés, nos centraremos en explicar cómo crear una curva de supervivencia para que el lector sea capaz de obtenerlas por sí mismo.

Lo haremos en Estadísticos>Análisis de supervivencia>Estimación de una función de supervivencia y seleccionamos los parámetros que se ven en la imagen que aparece a continuación. Se puede seleccionar como Estrato una variable categórica (“Tratamiento” en este caso) para obtener la función de cada grupo, o no seleccionar nada y obtener una función general. En este caso lo haremos por grupos.

base de datos R

Obtenemos el siguiente gráfico y vemos que, en este caso, la probabilidad de supervivencia (para este ejemplo coincide con la probabilidad de no estar contagiado en un tiempo determinado) se reduce con el paso del tiempo y es diferente para cada grupo.

analisis de supervivencia

Existe la opción de personalizar las gráficas obtenidas. Además, en Estadísticos>Resúmenes>Resúmenes numéricos podríamos ver el resumen estadístico general y por grupos. De hecho, somos conscientes de que este tema es complejo y el lector deberá profundizar más para poder realizar un análisis exhaustivo. Por el momento, lo dejaremos aquí, ya que hemos introducido las herramientas y conceptos básicos para familiarizarnos con este tipo de análisis.

Si quieres que te avisemos cuando subamos la siguiente práctica, suscríbete a nuestra newsletter y te mandaremos una notificación.

Suscríbete a nuestra newsletter

y te enviaremos gratuitamente nuestro e-book estadístico