Pérez-Moneo Agapito B, Ochoa Sangrador C, Cabrera Morente L. Calculadoras para análisis estratificado. Evid Pediatr. 2024;20:26.
Cuando la asociación entre la exposición en un estudio y el efecto puede ser explicada por una tercera variable (la variable de confusión), que no se distribuye homogéneamente entre los grupos o que altera los resultados, produciendo un aumento o disminución del efecto, se produce un sesgo de confusión. Pensamos en factor de confusión si el riesgo relativo (RR) crudo y el RR ajustado difieren de forma significativa.
Existe interacción o modificación de efecto cuando la asociación entre exposición y efecto varía según las categorías de una tercera variable, la variable modificadora de efecto. Si no analizamos la modificación del efecto para los diferentes valores de esa tercera variable, la estimación de la asociación será incompleta. Cuando existe interacción los RR crudo y ajustado globales serán iguales, mientras que los RR de cada estrato definido por la tercera variable serán diferentes, presentando uno de ellos un valor menor y el otro un valor mayor, respecto al valor nulo. Son los RR de cada subgrupo los únicos válidos en este análisis.
El control de sesgos de análisis puede realizarse durante el diseño (muestreo aleatorio, emparejamiento, etc.), o durante el análisis (análisis estratificado, análisis multivariante).
El análisis estratificado es una técnica estadística que permite detectar y/o controlar sesgos tanto de confusión como de interacción durante la fase de análisis. Cuando exploramos la asociación entre dos variables estimando, por ejemplo, medidas de riesgo como el RR o la odds ratio (OR), si separamos la muestra en subgrupos a partir de una tercera variable, obtendremos estimaciones de la asociación dentro de cada subgrupo. Si las estimaciones por subgrupos son diferentes de las calculadas para toda la muestra, puede existir algún sesgo de análisis que corregir. Habitualmente se consideran diferentes cambios de un 10% en las estimaciones. Cuando esto ocurre, la estimación agrupada no será válida, por lo que habrá que hacer un análisis estratificado. Los pasos a seguir en el análisis estratificado serían los siguientes:
A partir de ahora iremos viendo diferentes calculadoras, disponibles de forma gratuita, para ver cómo se hacen estos pasos.
Statulator es una calculadora estadística gratuita en línea que realiza análisis estadísticos, interpreta los resultados y hace sugerencias de redacción para su uso en documentos científicos. Ha sido desarrollada por los Dres. Navneet Dhand y Mehar Khatkar. Está disponible en la página www.statulator.com/stat/StratifiedAnalysis.html y se pueden realizar análisis de dos estratos. Los pasos a seguir serían los siguientes:
A continuación, podemos ver un ejemplo:
En un estudio de cohortes se siguió a 482 niños asmáticos, se midió la incidencia acumulada de crisis asmática en un periodo, en función de la exposición o no a tabaco en el hogar. Los resultados se presentan en la Tabla 1.
Tabla 1. Datos del estudio de cohortes de 482 niños asmáticos. Mostrar/ocultar
Si se introducen los datos en la calculadora Calcupedev se obtiene un RR de 1,72 (intervalo de confianza [IC] 95: 1,40 a 2,11), lo que se interpretaría como que la exposición a tabaco en el hogar aumenta el riesgo de tener una crisis asmática. En este estudio se sospecha que la contaminación ambiental puede ser un factor de confusión, por lo que elaboramos de nuevo la tabla separando los datos en los dos estratos (Tabla 2).
Tabla 2. Estratificación por contaminación ambiental de la cohorte de 482 niños asmáticos. Mostrar/ocultar
Comenzamos introduciendo los datos en Statulator (Figuras 1 y 2). En la pestaña de opciones (Figura 3), podemos escoger si el cálculo que queremos realizar es del RR o de la OR y el test de homogeneidad que se quiere usar, en nuestro caso el de Breslow-Day, además de poder nombrar los estratos y las variables de exposición y resultado (Figura 4).
Figura 1. Statulator. Análisis estratificado 1. Mostrar/ocultar
Figura 2. Statulator. Análisis estratificado 2. Mostrar/ocultar
Figura 3. Statulator. Análisis estratificado 3. Mostrar/ocultar
Figura 4. Statulator. Análisis estratificado 4. Mostrar/ocultar
Al dar a analizar obtenemos los resultados (Figura 5). Y en el siguiente botón “interpret results”, hace la interpretación de todos los resultados en un texto. Finalmente, hace una sugerencia de informe que se puede descargar para su uso posterior (Figura 6).
Figura 5. Statulator. Análisis estratificado 5. Mostrar/ocultar
Figura 6. Statulator. Análisis estratificado 6. Mostrar/ocultar
En resumen: la asociación entre la exposición a tabaco en el hogar y la aparición de crisis asmática no fue significativa después de ajustar por la variable “contaminación ambiental”.
OpenEpi es un software gratuito y de código abierto para estadísticas sobre epidemiología. Puede ejecutarse desde un servidor web o descargarse y luego ejecutarse sin una conexión web. Los programas precisan de versiones recientes de los navegadores y se puede usar en distintos sistemas operativos (Linux, Mac, Windows). También se pueden utilizar en muchos teléfonos móviles, tanto iPhone como Android. El desarrollo de OpenEpi ha sido financiado parcialmente por una beca de la fundación Bill and Melinda Gates concedida a la Rollins School of Public Health de la Universidad de Emory. La calculadora está disponible en la página web www.openepi.com/TwobyTwo/TwobyTwo.htm. Los cálculos se deben hacer siguiendo los mismos pasos que para cualquier análisis estratificado.
Utilizaremos esta herramienta en el siguiente ejemplo:
En un ensayo clínico hemos asignado a una muestra de 944 niños de alto riesgo de enfermedad celíaca la introducción del gluten en dos momentos diferentes: precoz (entre los 4 y 6 meses) o tardío (posterior a los 6 meses), para saber si influía en el riesgo de desarrollar la enfermedad. Los resultados se exponen en la Tabla 3. Según los resultados que podemos obtener con Calcupedev, la introducción precoz de gluten se asoció a un riesgo de enfermedad celiaca un 21% mayor (RR: 1,21; IC 95: 0,79 a 1,84), aunque la magnitud no era suficientemente precisa para poder asumir diferencias, ni a favor ni en contra (el intervalo de confianza incluía el 1). Sin embargo, nos interesa saber si algún otro factor ha podido influir en los resultados, en concreto el sexo de los pacientes. En este caso, estratificamos nuestra muestra en función del sexo (Tabla 4).
Tabla 3. Datos del estudio de edad de introducción del gluten. Mostrar/ocultar
Tabla 4. Estratificación por sexo del estudio de edad de introducción del gluten Mostrar/ocultar
Introducimos los datos en nuestra calculadora OpenEpi (Figura 7). En primer lugar, un estrato y, en segundo lugar, dando a la pestaña “agregar estrato”, los datos del otro. La calculadora nos permite cambiar el nombre de los valores para luego exportar los datos; la tabla de resultados será similar a la de la Figura 8.
Figura 7. OpenEpi. Introducción de datos. Mostrar/ocultar
Figura 8. OpenEpi. Tabla de resultados. Mostrar/ocultar
En nuestro caso, vemos que la razón de riesgo en el estrato 1 (varones) incluye el valor nulo, como ocurría con el RR crudo, pero el estrato 2 (mujeres) muestra un valor de RR de 1,92 (IC 95: 1,08 a 3,41), que no incluye el valor nulo. Si se analiza la homogeneidad entre estratos con la prueba Breslow-Day, vemos que el valor es significativo, luego no podríamos dar un valor de RR ajustado, sino que habría que dar cada valor por separado. En este caso, el sexo ha resultado ser un factor de interacción.
EPIDAT es un programa de libre distribución para el análisis epidemiológico de datos tabulados, que surgió en el marco de un convenio firmado por la Organización Panamericana de la Salud (OPS) y la Consellería de Sanidade de la Xunta de Galicia. Según definen sus propios creadores, sus objetivos son:
Esta herramienta también permite realizar análisis estratificado, se actualiza periódicamente y tiene varias versiones, pero no permite opción de trabajo en línea. Por tanto, es necesario descargarse la versión EPIDAT 3.1 desde la página web del Servicio Gallego de Salud: www.sergas.es/Saude-publica/Epidat-3-1-descargar-Epidat-3-1-(espanol) e ir al apartado Tablas de Contingencia/Tablas de asociación/Tablas 2 x 2/Tablas 2 x 2 estratificadas (Figura 9).
Figura 9. EPIDAT. Vista general del programa. Mostrar/ocultar
Vamos a ver el siguiente ejemplo:
Queremos evaluar la presencia de tensión arterial (TA) elevada en el grupo de adolescentes con sobrepeso de nuestro centro de salud que consumen café. Una vez recogidos los datos, se presentan en la tabla 2 x 2 de la Tabla 5. Si se introducen los datos en Calcupedev obtenemos un RR de 1,50 (IC 95: 1,19 a 1,90), lo que supone un 50% más de riesgo de presentar TA elevada en los casos de consumo de café alto.
Tabla 5. Datos del estudio de prevalencia de hipertensión arterial en adolescentes. Mostrar/ocultar
Pero nos interesa saber si puede haber una modificación del efecto por el peso, por lo que dividimos el grupo entre los chavales que cumplen criterios de sobrepeso y los que cumplen criterios de obesidad y volvemos a calcular los RR por estratos: en el caso de sobrepeso el RR es de 1 (IC 95: 0,57 a 1,76) y en el caso de la obesidad el RR es de 1 (IC 95: 0,75 a 1,33). Vemos que el RR ha cambiado al separar el grupo en dos estratos (Tabla 6).
Tabla 6. Estratificación por consumo de café. Mostrar/ocultar
Introducimos los datos en la calculadora de EPIDAT para obtener el análisis estratificado (Figura 10). En este caso, los estratos se rellenan en la misma hoja, en la primera línea el primero y en la segunda línea el segundo. Para obtener los resultados se debe dar al botón “calculadora” y se presentan como en la Figura 11. Se observa un RR crudo similar al obtenido con Calcupedev de 1,5 (IC 95: 1,19 a 1,90). La prueba de homogeneidad nos informa de que los estratos son homogéneos (p = 1), por lo que podemos dar nuestro RR ajustado, que es de 1 (IC 95: 0,76 a 1,30), no significativo, al incorporar el valor nulo en su intervalo de confianza y claramente diferente del RR crudo. En este caso, debemos dar como resultado final el RR ajustado, porque el peso es un factor de confusión.
Figura 10. EPIDAT. Introducción de datos. Mostrar/ocultar
Figura 11. EPIDAT. Tabla de resultados. Mostrar/ocultar
Epi Info™ es un software de recopilación, gestión, análisis, visualización y generación de informes de datos para profesionales de la salud pública. Es una marca registrada de los Centros para el Control y la Prevención de Enfermedades (CDC). El software es de dominio público y está disponible gratuitamente para su uso, copia, traducción y distribución. Actualmente, solo puede utilizarse en Windows y tiene una guía del usuario con tutoriales, explicaciones mediante ejemplos, plantillas y programas de muestra. Se descarga desde la página web www.cdc.gov/epiinfo/esp/es_index.html
Para ver cómo se utiliza veremos un último ejemplo ficticio:
Queremos estudiar si la presencia de moco en heces se asocia con un origen bacteriano de una gastroenteritis. Para ello, recopilamos los datos de un grupo de 23 niños con gastroenteritis (GEA) y presentamos los datos en nuestra tabla 2 x 2 (Tabla 7). Si introducimos los datos en Calcupedev obtenemos un valor de RR de 1,56 (IC 95: 1,06 a 2,28), lo que supone que la presencia de moco en heces supondría un 56% más de riesgo de tener una GEA bacteriana. El problema es que nos parece que la presencia de sangre en las heces puede ser un factor de confusión, por eso planteamos la tabla con los dos estratos y lo rellenamos según la Tabla 8. Posteriormente, los introducimos en el programa para hacer el análisis estratificado. En esta página daremos al botón de STATCALC y luego a las tablas 2 x 2 (Figura 12).
Tabla 7. Datos del estudio de etiología de la gastroenteritis. Mostrar/ocultar
Tabla 8. Estratificación por presencia de sangre en las heces. Mostrar/ocultar
Figura 12. Epi Info. Vista general del programa. Mostrar/ocultar
Al abrir las tablas 2 x 2 se ven las diferentes pestañas de cada estrato en las filas (Figura 13). Al introducir el segundo estrato, muestra la pantalla de resultados completa (Figura 14), donde, además de ver los RR por cada estrato, vemos el resultado de la prueba de homogeneidad y el RR ajustado. En nuestro caso, la presencia de sangre en heces resulta un factor de confusión: los RR en cada estrato son distintos al RR crudo (RR del estrato “con sangre” es de 0,84; IC 95: 0,53 a 1,36 y el RR del estrato “sin sangre” es de 1,11; IC 95: 0,61 a 2,00) y los estratos son homogéneos (Corrected MH p = 0,90), por lo que daremos el valor de RR ajustado de Mantel-Haenzel de 1,02 (IC 95: 0,66 a 1,56).
Figura 13. Epi Info™. Introducción de los datos del primer estrato. Mostrar/ocultar
Figura 14. Epi Info™. Introducción de los datos del segundo estrato y resultados. Mostrar/ocultar
Pérez-Moneo Agapito B, Ochoa Sangrador C, Cabrera Morente L. Calculadoras para análisis estratificado. Evid Pediatr. 2024;20:26.