Junio 2024. Volumen 20. Número 2

Calculadoras para análisis estratificado

Valoración: 0 (0 Votos)

Autores: Pérez-Moneo Agapito B, Ochoa Sangrador C, Cabrera Morente L.

Compartir |

Suscripción gratuita al boletín de novedades

Reciba periódicamente por correo electrónico los últimos artículos publicados

Artículo completo
PDF

Imprimir

Añadir a biblioteca

Comentar este artículo

MBE | Fundamentos de Medicina Basada en la Evidencia

Autores: Pérez-Moneo Agapito B¹, Ochoa Sangrador C², Cabrera Morente L³.

¹Servicio de Pediatría. Hospital Universitario Infanta Leonor. Universidad Complutense de Madrid. Madrid. España.
²Servicio de Pediatría. Complejo Asistencial de Zamora. Zamora. España.
³Pediatra. CS San Felipe. Distrito Sanitario de Jaén. Jaén. España.

Correspondencia: Begoña Pérez-Moneo Agapito. Correo electrónico: begopma@gmail.com

Fecha de recepción: 26/05/2024

Fecha de aceptación: 06/06/2024

Fecha de publicación: 19/06/2024

Palabras clave: análisis estadístico; aplicación de informática médica; estadística

Cómo citar este artículo

Pérez-Moneo Agapito B, Ochoa Sangrador C, Cabrera Morente L. Calculadoras para análisis estratificado. Evid Pediatr. 2023;20:26.

MBE | Fundamentos de Medicina Basada en la Evidencia

Autores: Pérez-Moneo Agapito B¹, Ochoa Sangrador C², Cabrera Morente L³.

Correspondencia: Begoña Pérez-Moneo Agapito. Correo electrónico: begopma@gmail.com

Palabras clave: análisis estadístico; aplicación de informática médica; estadística

Fecha de recepción: 26/05/2024

Fecha de aceptación: 06/06/2024

Fecha de publicación: 19/06/2024

INTRODUCCIÓN

Cuando la asociación entre la exposición en un estudio y el efecto puede ser explicada por una tercera variable (la variable de confusión), que no se distribuye homogéneamente entre los grupos o que altera los resultados, produciendo un aumento o disminución del efecto, se produce un sesgo de confusión. Pensamos en factor de confusión si el riesgo relativo (RR) crudo y el RR ajustado difieren de forma significativa.

Existe interacción o modificación de efecto cuando la asociación entre exposición y efecto varía según las categorías de una tercera variable, la variable modificadora de efecto. Si no analizamos la modificación del efecto para los diferentes valores de esa tercera variable, la estimación de la asociación será incompleta. Cuando existe interacción los RR crudo y ajustado globales serán iguales, mientras que los RR de cada estrato definido por la tercera variable serán diferentes, presentando uno de ellos un valor menor y el otro un valor mayor, respecto al valor nulo. Son los RR de cada subgrupo los únicos válidos en este análisis.

El control de sesgos de análisis puede realizarse durante el diseño (muestreo aleatorio, emparejamiento, etc.), o durante el análisis (análisis estratificado, análisis multivariante).

Control de sesgos de confusión o interacción durante el análisis. Análisis estratificado

El análisis estratificado es una técnica estadística que permite detectar y/o controlar sesgos tanto de confusión como de interacción durante la fase de análisis. Cuando exploramos la asociación entre dos variables estimando, por ejemplo, medidas de riesgo como el RR o la odds ratio (OR), si separamos la muestra en subgrupos a partir de una tercera variable, obtendremos estimaciones de la asociación dentro de cada subgrupo. Si las estimaciones por subgrupos son diferentes de las calculadas para toda la muestra, puede existir algún sesgo de análisis que corregir. Habitualmente se consideran diferentes cambios de un 10% en las estimaciones. Cuando esto ocurre, la estimación agrupada no será válida, por lo que habrá que hacer un análisis estratificado. Los pasos a seguir en el análisis estratificado serían los siguientes:

Calculamos el RR u OR en crudo (sin estratificar).
Estratificamos por la tercera variable a controlar y calculamos el RR u OR específico de cada estrato.
Evaluamos la homogeneidad de las estimaciones del efecto en los estratos. Para ello disponemos de test estadísticos para contrastar la homogeneidad (test de homogeneidad de Breslow-Day, test de homogeneidad de Mantel-Haenszel), que proporcionan las calculadoras y paquetes estadísticos.
Si hay homogeneidad entre las estimaciones del efecto entre los estratos calculamos el RR u OR general ajustado mediante la fórmula de Mantel-Haenszel.
- Si hay homogeneidad entre estratos y existen diferencias entre la estimación cruda y ajustada, existe sesgo de confusión. Calculando la diferencia entre ambas estimaciones podemos cuantificar la magnitud de la confusión; habitualmente una diferencia superior al 10% se considera suficiente e importante si es superior al 20%.
- Si hay heterogeneidad entre estratos probablemente existe interacción o modificación del efecto. En este caso debemos informar las estimaciones de cada estrato por separado.

A partir de ahora iremos viendo diferentes calculadoras, disponibles de forma gratuita, para ver cómo se hacen estos pasos.

Statulator

Statulator es una calculadora estadística gratuita en línea que realiza análisis estadísticos, interpreta los resultados y hace sugerencias de redacción para su uso en documentos científicos. Ha sido desarrollada por los Dres. Navneet Dhand y Mehar Khatkar. Está disponible en la página www.statulator.com/stat/StratifiedAnalysis.html y se pueden realizar análisis de dos estratos. Los pasos a seguir serían los siguientes:

En primer lugar, hay que obtener el RR u OR de la muestra completa.
Posteriormente, hay que realizar la tabla 2 x 2 por estratos y calcular la OR o el RR estratificados, con la prueba de homogeneidad correspondiente.
En el caso de Statulator, realiza el OR o el RR agrupado de Mantel-Haenszel y evalúa su importancia mediante la prueba ji-cuadrado de Cochran-Mantel-Haenszel.
Finalmente, interpreta los resultados y da sugerencias para presentarlos en informes, disertaciones o artículos de revistas.

A continuación, podemos ver un ejemplo:

En un estudio de cohortes se siguió a 482 niños asmáticos, se midió la incidencia acumulada de crisis asmática en un periodo, en función de la exposición o no a tabaco en el hogar. Los resultados se presentan en la Tabla 1.

Tabla 1. Datos del estudio de cohortes de 482 niños asmáticos. Mostrar/ocultar

Exposición a tabaco en el hogar	Crisis asmática	Total
Sí	60	36	96
No	140	246	386
Total	200	282	482

Si se introducen los datos en la calculadora Calcupedev se obtiene un RR de 1,72 (intervalo de confianza [IC] 95: 1,40 a 2,11), lo que se interpretaría como que la exposición a tabaco en el hogar aumenta el riesgo de tener una crisis asmática. En este estudio se sospecha que la contaminación ambiental puede ser un factor de confusión, por lo que elaboramos de nuevo la tabla separando los datos en los dos estratos (Tabla 2).

Tabla 2. Estratificación por contaminación ambiental de la cohorte de 482 niños asmáticos. Mostrar/ocultar

Contaminación ambiental	Exposición a tabaco en el hogar	Crisis asmática	Total
Alta	Sí	50	20	70
No	50	30	80
Subtotal	100	50	150
Baja	Sí	10	16	26
No	90	216	306
Subtotal	100	232	332

Comenzamos introduciendo los datos en Statulator (Figuras 1 y 2). En la pestaña de opciones (Figura 3), podemos escoger si el cálculo que queremos realizar es del RR o de la OR y el test de homogeneidad que se quiere usar, en nuestro caso el de Breslow-Day, además de poder nombrar los estratos y las variables de exposición y resultado (Figura 4).

Figura 1. Statulator. Análisis estratificado 1. Mostrar/ocultar

Figura 2. Statulator. Análisis estratificado 2. Mostrar/ocultar

Figura 3. Statulator. Análisis estratificado 3. Mostrar/ocultar

Figura 4. Statulator. Análisis estratificado 4. Mostrar/ocultar

Al dar a analizar obtenemos los resultados (Figura 5). Y en el siguiente botón “interpret results”, hace la interpretación de todos los resultados en un texto. Finalmente, hace una sugerencia de informe que se puede descargar para su uso posterior (Figura 6).

Figura 5. Statulator. Análisis estratificado 5. Mostrar/ocultar

Figura 6. Statulator. Análisis estratificado 6. Mostrar/ocultar

En resumen: la asociación entre la exposición a tabaco en el hogar y la aparición de crisis asmática no fue significativa después de ajustar por la variable “contaminación ambiental”.

OpenEpi

OpenEpi es un software gratuito y de código abierto para estadísticas sobre epidemiología. Puede ejecutarse desde un servidor web o descargarse y luego ejecutarse sin una conexión web. Los programas precisan de versiones recientes de los navegadores y se puede usar en distintos sistemas operativos (Linux, Mac, Windows). También se pueden utilizar en muchos teléfonos móviles, tanto iPhone como Android. El desarrollo de OpenEpi ha sido financiado parcialmente por una beca de la fundación Bill and Melinda Gates concedida a la Rollins School of Public Health de la Universidad de Emory. La calculadora está disponible en la página web www.openepi.com/TwobyTwo/TwobyTwo.htm. Los cálculos se deben hacer siguiendo los mismos pasos que para cualquier análisis estratificado.

Utilizaremos esta herramienta en el siguiente ejemplo:

En un ensayo clínico hemos asignado a una muestra de 944 niños de alto riesgo de enfermedad celíaca la introducción del gluten en dos momentos diferentes: precoz (entre los 4 y 6 meses) o tardío (posterior a los 6 meses), para saber si influía en el riesgo de desarrollar la enfermedad. Los resultados se exponen en la Tabla 3. Según los resultados que podemos obtener con Calcupedev, la introducción precoz de gluten se asoció a un riesgo de enfermedad celiaca un 21% mayor (RR: 1,21; IC 95: 0,79 a 1,84), aunque la magnitud no era suficientemente precisa para poder asumir diferencias, ni a favor ni en contra (el intervalo de confianza incluía el 1). Sin embargo, nos interesa saber si algún otro factor ha podido influir en los resultados, en concreto el sexo de los pacientes. En este caso, estratificamos nuestra muestra en función del sexo (Tabla 4).

Tabla 3. Datos del estudio de edad de introducción del gluten. Mostrar/ocultar

Introducción del gluten	Enfermedad celíaca	Total
Precoz (4-6 meses)	44	431	475
Tardía (> 6 meses)	36	433	469
Total	80	864	944

Tabla 4. Estratificación por sexo del estudio de edad de introducción del gluten Mostrar/ocultar

Sexo	Introducción del gluten	Enfermedad celíaca	Total
Femenino	Precoz	31	197	228
Tardío	16	210	226
Subtotal	47	407	454
Masculino	Precoz	13	234	247
Tardío	20	223	243
Subtotal	33	457	490

Introducimos los datos en nuestra calculadora OpenEpi (Figura 7). En primer lugar, un estrato y, en segundo lugar, dando a la pestaña “agregar estrato”, los datos del otro. La calculadora nos permite cambiar el nombre de los valores para luego exportar los datos; la tabla de resultados será similar a la de la Figura 8.

Figura 7. OpenEpi. Introducción de datos. Mostrar/ocultar

Figura 8. OpenEpi. Tabla de resultados. Mostrar/ocultar

En nuestro caso, vemos que la razón de riesgo en el estrato 1 (varones) incluye el valor nulo, como ocurría con el RR crudo, pero el estrato 2 (mujeres) muestra un valor de RR de 1,92 (IC 95: 1,08 a 3,41), que no incluye el valor nulo. Si se analiza la homogeneidad entre estratos con la prueba Breslow-Day, vemos que el valor es significativo, luego no podríamos dar un valor de RR ajustado, sino que habría que dar cada valor por separado. En este caso, el sexo ha resultado ser un factor de interacción.

EPIDAT

EPIDAT es un programa de libre distribución para el análisis epidemiológico de datos tabulados, que surgió en el marco de un convenio firmado por la Organización Panamericana de la Salud (OPS) y la Consellería de Sanidade de la Xunta de Galicia. Según definen sus propios creadores, sus objetivos son:

Aportar una herramienta de manejo sencillo y de utilidad para el análisis de datos tabulados.
Apoyar y facilitar la docencia en epidemiología, tanto en el ámbito de la cooperación técnica como en el universitario.
Fortalecer la capacidad analítica de los profesionales de salud de los países.
Servir como fuente para la formación autodidacta en zonas escogidas de la estadística aplicada a la epidemiología.

Esta herramienta también permite realizar análisis estratificado, se actualiza periódicamente y tiene varias versiones, pero no permite opción de trabajo en línea. Por tanto, es necesario descargarse la versión EPIDAT 3.1 desde la página web del Servicio Gallego de Salud: www.sergas.es/Saude-publica/Epidat-3-1-descargar-Epidat-3-1-(espanol) e ir al apartado Tablas de Contingencia/Tablas de asociación/Tablas 2 x 2/Tablas 2 x 2 estratificadas (Figura 9).

Figura 9. EPIDAT. Vista general del programa. Mostrar/ocultar

Vamos a ver el siguiente ejemplo:

Queremos evaluar la presencia de tensión arterial (TA) elevada en el grupo de adolescentes con sobrepeso de nuestro centro de salud que consumen café. Una vez recogidos los datos, se presentan en la tabla 2 x 2 de la Tabla 5. Si se introducen los datos en Calcupedev obtenemos un RR de 1,50 (IC 95: 1,19 a 1,90), lo que supone un 50% más de riesgo de presentar TA elevada en los casos de consumo de café alto.

Tabla 5. Datos del estudio de prevalencia de hipertensión arterial en adolescentes. Mostrar/ocultar

	Consumo alto de café	Tensión arterial elevada	Total
Adolescentes con peso elevado	Sí	90	60	150
No	60	90	150
Total	150	150	300

Pero nos interesa saber si puede haber una modificación del efecto por el peso, por lo que dividimos el grupo entre los chavales que cumplen criterios de sobrepeso y los que cumplen criterios de obesidad y volvemos a calcular los RR por estratos: en el caso de sobrepeso el RR es de 1 (IC 95: 0,57 a 1,76) y en el caso de la obesidad el RR es de 1 (IC 95: 0,75 a 1,33). Vemos que el RR ha cambiado al separar el grupo en dos estratos (Tabla 6).

Tabla 6. Estratificación por consumo de café. Mostrar/ocultar

Peso elevado	Consumo alto de café	Tensión arterial elevada	Total
Con criterios de sobrepeso	Sí	10	20	30
No	40	80	120
Con criterios de obesidad	Sí	80	40	120
No	20	10	30

Introducimos los datos en la calculadora de EPIDAT para obtener el análisis estratificado (Figura 10). En este caso, los estratos se rellenan en la misma hoja, en la primera línea el primero y en la segunda línea el segundo. Para obtener los resultados se debe dar al botón “calculadora” y se presentan como en la Figura 11. Se observa un RR crudo similar al obtenido con Calcupedev de 1,5 (IC 95: 1,19 a 1,90). La prueba de homogeneidad nos informa de que los estratos son homogéneos (p = 1), por lo que podemos dar nuestro RR ajustado, que es de 1 (IC 95: 0,76 a 1,30), no significativo, al incorporar el valor nulo en su intervalo de confianza y claramente diferente del RR crudo. En este caso, debemos dar como resultado final el RR ajustado, porque el peso es un factor de confusión.

Figura 10. EPIDAT. Introducción de datos. Mostrar/ocultar

Figura 11. EPIDAT. Tabla de resultados. Mostrar/ocultar

Epi Info™

Epi Info™ es un software de recopilación, gestión, análisis, visualización y generación de informes de datos para profesionales de la salud pública. Es una marca registrada de los Centros para el Control y la Prevención de Enfermedades (CDC). El software es de dominio público y está disponible gratuitamente para su uso, copia, traducción y distribución. Actualmente, solo puede utilizarse en Windows y tiene una guía del usuario con tutoriales, explicaciones mediante ejemplos, plantillas y programas de muestra. Se descarga desde la página web www.cdc.gov/epiinfo/esp/es_index.html

Para ver cómo se utiliza veremos un último ejemplo ficticio:

Queremos estudiar si la presencia de moco en heces se asocia con un origen bacteriano de una gastroenteritis. Para ello, recopilamos los datos de un grupo de 23 niños con gastroenteritis (GEA) y presentamos los datos en nuestra tabla 2 x 2 (Tabla 7). Si introducimos los datos en Calcupedev obtenemos un valor de RR de 1,56 (IC 95: 1,06 a 2,28), lo que supone que la presencia de moco en heces supondría un 56% más de riesgo de tener una GEA bacteriana. El problema es que nos parece que la presencia de sangre en las heces puede ser un factor de confusión, por eso planteamos la tabla con los dos estratos y lo rellenamos según la Tabla 8. Posteriormente, los introducimos en el programa para hacer el análisis estratificado. En esta página daremos al botón de STATCALC y luego a las tablas 2 x 2 (Figura 12).

Tabla 7. Datos del estudio de etiología de la gastroenteritis. Mostrar/ocultar

	Moco en heces	Gastroenteritis bacteriana	Total
Gastroenteritis en la infancia	Sí	21	26	47
No	60	149	209
Total	81	175	256

Tabla 8. Estratificación por presencia de sangre en las heces. Mostrar/ocultar

	Moco en heces	Gastroenteritis bacteriana	Total
Con sangre en heces	Sí	12	5	17
No	5	1	6
Sin sangre en heces	Sí	9	21	30
No	55	148	203

Figura 12. Epi Info. Vista general del programa. Mostrar/ocultar

Al abrir las tablas 2 x 2 se ven las diferentes pestañas de cada estrato en las filas (Figura 13). Al introducir el segundo estrato, muestra la pantalla de resultados completa (Figura 14), donde, además de ver los RR por cada estrato, vemos el resultado de la prueba de homogeneidad y el RR ajustado. En nuestro caso, la presencia de sangre en heces resulta un factor de confusión: los RR en cada estrato son distintos al RR crudo (RR del estrato “con sangre” es de 0,84; IC 95: 0,53 a 1,36 y el RR del estrato “sin sangre” es de 1,11; IC 95: 0,61 a 2,00) y los estratos son homogéneos (Corrected MH p = 0,90), por lo que daremos el valor de RR ajustado de Mantel-Haenzel de 1,02 (IC 95: 0,66 a 1,56).

Figura 13. Epi Info™. Introducción de los datos del primer estrato. Mostrar/ocultar

Figura 14. Epi Info™. Introducción de los datos del segundo estrato y resultados. Mostrar/ocultar

Bibliografía

Dean AG, Sullivan KM, Soe MM. OpenEpi: Open Source Epidemiologic Statistics for Public Health [en línea] [actualizado el 06/04/2013/04; consultado el 12/06/2024]. Disponible en www.OpenEpi.com
Dhand NK, Khatkar MS. Statulator. An online calculator that conducts statistical analyses and interprets the results: Stratified Analyses; 2014 [en línea] [consultado el 12/06/2024]. Disponible en https://statulator.com/stat/StratifiedAnalysis.html
EPIDAT: programa para análisis epidemiológico de datos. Versión 3.1; 2006. En: Consellería de Sanidade, Xunta de Galicia [en línea] [consultado el 12/06/2024]. Disponible en www.sergas.es/Saude-publica/Epidat-3-1-descargar-Epidat-3-1-(espanol)
Epi Info. Office of Public Health Data, Surveillance and Technology; 2022 [en línea] [consultado el 12/06/2024]. Disponible en www.cdc.gov/epiinfo/esp/es_index.html
Ochoa Sangrador C, Molina Arias M, Ortega Páez E. Métodos de ajuste de sesgos. Análisis estratificado. Evid Pediatr. 2022; 18:31.
Rothman K, Greenland S. Introduction to stratified analysis. Modern Epidemiology. 2^nd Philadelphia: Lippincott Williams and Wilkins; 1998. p. 253.