Los estudios ecológicos forman parte de los diseños observaciones en Epidemiología, que se distinguen del resto porque la población de estudio no son sujetos individuales, sino sujetos agrupados, normalmente grupos de personas (países, provincias, escuelas, etc.); esto hace que el nivel de inferencia de sus estimaciones sea también agregado. Clásicamente se han utilizado como generadores de hipótesis ya que son sencillos de realizar, rápidos, poco costosos y su análisis relativamente sencillo, o para la comprobación del impacto de la implantación de medidas de salud, por ejemplo, campañas vacunales. Habitualmente son estudios descriptivos y de temporalidad histórica, pero pueden ser analíticos y concurrentes, aunque la medición agrupada de exposición y efecto les confiere un alto riesgo de presentar sesgos. Por ello se les ha considerado tradicionalmente como estudios de bajo nivel de evidencia. En los últimos tiempos han resurgido, debido, en gran parte, al desarrollo de novedosas técnicas estadísticas que han mejorado su utilidad.
Los estudios ecológicos tienen peculiaridades en cuanto al tipo de variables que se miden y al tipo de análisis descriptivo e inferencial. Tipos de variables
Clásicamente, las variables ecológicas se clasifican en variables agregadas, ambientales o globales. Las variables agregadas suelen ser medidas que resumen observaciones individuales, normalmente medias (por ejemplo, edad media al inicio de consumo de alcohol) o proporciones (por ejemplo, tasa de mortalidad neonatal/1000 recién nacidos vivos). Las medidas ambientales, son características físicas propias de un lugar determinado, que suelen tener su paralelismo a nivel individual (por ejemplo, niveles de polución atmosférica) o atributos de grupos, organizaciones o lugares, que no tienen una equivalencia a nivel individual (por ejemplo, densidad de población, tipo de sistema sanitario).
Niveles de análisis
En general, el análisis se realiza en un solo nivel, bien sea agregado (datos de grupos de sujetos) o individual (datos de sujetos). Si los datos han sido recogidos en distintos niveles se deben trasformar en un solo nivel. Lo usual es transformar los datos individuales en agregados, por ejemplo calculando las medias o proporciones. Pero también se puede realizar en sentido contrario, desagregando las variables; por ejemplo, en un estudio para medir la radiación individual después de la catástrofe de Chernóbil, la exposición de cada individuo se puede calcular por la distancia a la que estuviera del lugar de la explosión. Por último, se puede realizar un análisis en los dos niveles, mediante técnicas estadísticas multinivel jerarquizado, cuya explicación excede del objetivo de esta revisión2.
Niveles de inferencia
El nivel de inferencia depende de nuestros objetivos. Supongamos que queremos hacer una inferencia sobre efectos de un factor de riesgo a nivel individual, entonces la inferencia será individual; por ejemplo, un estudio en el que se quiere relacionar el consumo de alimentos preprocesados (estimado a partir de una encuesta telefónica) con la incidencia de cáncer de colon (medido a partir de registro de tumores). Ahora supongamos que estamos interesados en conocer la efectividad de un programa vacunal, entonces nuestras medidas e inferencias se harán de forma agregada a partir de las tasas de coberturas vacunales de una población. Por último, podemos medir un factor de exposición a nivel individual y agrupado; por ejemplo, contamos con medidas de higiene a nivel poblacional (por ejemplo, grado de potabilización de aguas) y a nivel individual (por ejemplo, frecuencia de lavado de manos); en este caso estaríamos en una inferencia contextual.
Clásicamente se han diferenciado los estudios ecológicos según dos tipos de dimensiones: el método de exposición y el de agrupación. En cuanto al método de exposición, nos podemos encontrar dos situaciones: si la variable primaria de exposición no se mide o solo se hace parcialmente se denominan exploratorios, en el caso contrario analíticos. Según el método de agrupación se pueden clasificar en múltiples, cuando se seleccionan varias zonas; de tendencia temporal, si existe medición a lo largo del tiempo, y mixtos, cuando se combinan ambos métodos. Las dos dimensiones a su vez se pueden combinar dando lugar a diseños más complejos como veremos a continuación.
Estudios de grupos múltiples
Estudios de tendencia temporal
Estudios mixtos
Estos estudios comparan las tendencias temporales de varias áreas geográficas. El análisis estadístico es similar. Un ejemplo sería el estudio que realizaron Aceituno Madera et al. para relacionar la prevalencia de melanoma, la altitud y la radiación solar en varias zonas geográficas de la provincia de Granada durante el periodo de 1982-20079.
En muchos trabajos sobre estudios ecológicos, el análisis de los datos entre los factores de riesgo de exposición y la tasa de enfermedad se realiza por medio de pruebas estadísticas de asociación. Lo más común es medir la existencia de correlación lineal entre dos variables cuantitativas o de asociación entre variables cualitativas.
Mientras que los estudios observacionales con sujetos individuales podemos estimar directamente medidas de efecto (diferencias de riesgos), de riesgo (riesgo relativo, odds ratio) o de impacto (fracción atribuible), en los estudios ecológicos esto no es posible porque al usar medidas agrupadas desconocemos cuanto sujetos expuestos o no expuestos tienen la enfermedad.
Para estimar el efecto en los estudios ecológicos lo más habitual es recurrir a modelos de regresión entre la tasa de enfermedad (variable dependiente) y los factores exposición o prevalencia (variables independientes). El modelo más frecuentemente utilizado es el de regresión lineal, ya que las variables habitualmente son continuas, pudiéndose realizar modelos predictivos según la siguiente ecuación: Y = b0 + b1X, donde Y sería la tasa de enfermedad, X el factor de riesgo, b0 sería la constante del modelo y b1 el cambio medio de la tasa de enfermedad por unidad de exposición (X)1,3. Con este modelo aditivo se asume una estimación del efecto biológico a nivel individual11,12. De la ecuación anterior podemos calcular las tasas de enfermedad en los totalmente expuestos (X = 1) y en los totalmente no expuestos (X = 0), y a partir de ellas la diferencia de tasas, la razón de tasas, la fracción atribuible en los expuestos y la fracción atribuible poblacional10.
Para la estimación de los coeficientes de la ecuación de regresión se tienen en cuenta los valores medios de exposición; sin embargo, para calcular las tasas nosotros recurrimos a los valores extremos (0 y 1), lo que en ocasiones da lugar a tasas desproporcionadas o incluso negativas. Una posible solución es emplear modelos multiplicativos log-lineales o modelos de regresión de Poisson si la variable objeto de estudio es muy poco frecuente o es discreta. Por último, cuando se miden variables en distintos niveles se pueden emplear análisis multinivel donde se pueden separar los efectos a nivel individual y poblacional y evaluar sus interacciones2.
Los estudios ecológicos, por su especial diseño en el que la unidad de análisis es agregada, están sujetos a numerosos problemas metodológicos o sesgos que pueden desvirtuar la relación entre la exposición y la tasa de enfermedad de manera importante. Algunos de los sesgos presentes en estos estudios tienen peculiaridades propias que merece la pena comentar.
Algunos de estos aspectos ya se han adelantado con anterioridad. Resumiendo, podemos decir:
Ventajas
Limitaciones
En la Tabla 1 se puede ver una comparación entre los estudios ecológicos e individuales.
Tabla 1. Comparación de los estudios ecológicos e individuales Mostrar/ocultar
Ortega Páez E, Ochoa Sangrador C.Estudios ecológicos en Epidemiología. Evid Pediatr. 2015;11:69.