Medicina Basada en la Evidencia
Comparación de más de dos medias. Análisis de la varianza… – 587 – CONDICIONES PARA REALIZAR UN ANOVA Para poder realizar un ANOVA de una vía o factor debe- mos verificar que se cumplen tres condiciones: 1. Independencia de las observaciones: las observa- ciones deben ser aleatorias y los grupos deben ser independientes. 2. La variable cuantitativa debe distribuirse de forma normal en cada uno de los grupos de la variable cualitativa. 3. Homocedasticidad: la varianza dentro de los grupos debe ser similar en todos ellos. Aunque el ANOVA es bastante robusto a la ausencia de normalidad, si la asimetría es muy grande (grupos con tamaños muy diferentes), será conveniente reali- zar su equivalente no paramétrico, que es la prueba de Kruskal-Wallis. ANOVA es aún más robusto ante la au- sencia de homocedasticidad, aunque si los grupos son de tamaño desigual convendrá realizarlo aplicando la corrección de Welch (lo que en algunos programas se denomina ANOVA heterocedástico). EJEMPLO PRÁCTICO DE ANOVA Veamos un ejemplo: A continuación, realizaremos un ejemplo utilizando un programa de acceso libre, el software estadístico R ( https://www.r-project.org/ ) con el plugin RComman- der y esta base de datos . Se trata de una base de datos con 197 registros de pesos de recién nacidos a término con la que tra- taremos de ver si la edad de la madre influye en el peso al nacer de estos niños. Para ello, comparare- mos las medias del peso al nacimiento (“pesorn”, va- riable cuantitativa) entre tres grupos diferentes en los que hemos categorizado la edad materna (“Edad- Mat_Grupos”, variable cualitativa con 3 factores o categorías: “menor de 19 años”, “de 19 a 34 años” y “mayor o igual a 35 años”). En el Anexo 1 de este ca- pítulo encontrará las instrucciones para realizar este ejercicio práctico. Una vez cargada la base de datos, comprobaremos que la variable cuantitativa sigue una distribución normal en las tres categorías de la variable cualitativa. En primer lugar, realizamos una prueba de normali- dad, como la de Shapiro-Wilk, para comprobar que la media del peso al nacimiento sigue esta distribución para las 3 categorías de la variable cualitativa. El resultado nos dice que los valores de p del contras- te son 0,25, 0,64 y 0,31 para los grupos de menor de 19 años, de 19 a 34 y mayor o igual a 35 años, respec- tivamente. Al ser los valores de p >0,05 no podemos rechazar la hipótesis nula que, en el caso de la prueba de Shapiro-Wilk, supone que los datos se ajustan a una distribución normal. Para mayor seguridad, completamos esta prueba con un método gráfico, como el del gráfico de quantiles, que se muestran en la Figura 1 . Podemos ver que los datos se ajustan razonablemente a la diagonal del gráfico, lo que quiere decir que los cuantiles son simi- lares a los teóricos si se ajustasen a una distribución normal. Corroboramos así que el peso al nacimiento se distribuye de forma normal en los tres grupos de la variable “EdadMat_Grupos”. Una vez comprobado el supuesto de normalidad, pro- cederemos a comprobar el de homocedasticidad. Realizamos una prueba de Barlett y obtenemos un valor de p = 0,13, con lo que no podemos rechazar la hipótesis nula de igualdad de varianzas. Nuestras observaciones son independientes y, como hemos comprobado, se cumplen los supuestos de normalidad y homocedasticidad. Podemos proceder con el ANOVA. Figura 1. Gráficos de comparación de quantiles de la variable longitud del recién nacido por grupos de edad materna EdadMat_Grupos = 19-34 norm quantiles norm quantiles norm quantiles EdadMat_Grupos = Mayor/igual 35 EdadMat_Grupos = Menor 19 -2 -1 0 1 2 -2 -1 0 1 2 -2 -1 0 1 2 4.0 3.5 3.0 2.5 4.0 3.5 3.0 2.5 4.0 3.5 3.0 2.5
RkJQdWJsaXNoZXIy MTAwMjkz