Medicina Basada en la Evidencia
Comparación de más de dos medias. Análisis de la varianza… – 585 – INTRODUCCIÓN V amos a abordar la comparación de más de dos medias. La primera posibilidad que se nos puede ocurrir en estos casos es la de comparar las me- dias dos a dos utilizando una de las pruebas descritas para la comparación de medias, como la de la t de Stu- dent. Sin embargo, como veremos más adelante, esto no sería correcto, ya que las sucesivas comparaciones aumentarían la probabilidad de cometer un error de tipo I, esto es, de detectar un falso positivo y obtener diferencias significativas solo por azar. Por ello, para comparar más de dos medias, utilizare- mos una técnica denominada análisis de la varianza (ANOVA). El ANOVA no compara medias, sino varianzas, aunque se sirve de las varianzas de las variables para comparar sus medias. Existen varios tipos de ANOVA, aunque en este capítulo nos centraremos en su forma más sencilla, el ANOVA de un factor para medias independientes. CÁLCULO DEL ANOVA La hipótesis nula del ANOVA plantea que no existen dife- rencias entre las medias de los grupos estudiados. Por su parte, la hipótesis alternativa plantea que sí existen di- ferencias, al menos, entre dos de las medias estudiadas, pero no nos dice entre cuáles. Esto tendremos que de- terminarlo en un paso adicional, denominado habitual- mente análisis post hoc , y que veremos más adelante. Veamos en qué se basa y cómo se lleva a cabo el proce- dimiento del ANOVA. Los primeros estadísticos que podemos calcular son la media y la varianza globales de toda la muestra. Segui- OBJETIVOS: ■ Diferenciar los conceptos de media y varianza ■ Conocer el fundamento teórico de la comparación de más de dos medias mediante la prueba del análisis de la varianza ■ Comprender el problema de las comparaciones múltiples ■ Realizar el análisis de la varianza de forma práctica “Se mide la inteligencia de un individuo por la cantidad de incertidumbres que es capaz de soportar” Kant damente, podemos calcular las medias agrupadas por el factor que queremos estudiar. Son estas medias las que estamos interesados en comparar. A continuación, podemos suponer que el valor de una variable cuantitativa de un individuo concreto puede igualarse a la suma de tres componentes: la media de su grupo, la variabilidad debida a las características de ese grupo y la variabilidad debida al azar (aleatoria): x ij = x j + s j + e donde x ij representa el valor del individuo i del grupo j , x j la media del grupo j y s j la varianza debida al grupo y e expresa el error aleatorio. Si la hipótesis nula es cierta y no hay diferencias entre los distintos grupos, el componente s j será pequeño, si- milar al componente aleatorio ( e ) o incluso menor, así que el cociente entre ambos valdrá 1 o menos de 1. En el caso de que sí existan diferencias entre grupos, el valor del cociente será mayor que 1, ya que la varianza entre grupos será más alta mientras que el error aleatorio se mantendrá de forma similar. Una vez entendido esto, el siguiente paso será identifi- car los componentes de la varianza . Como ya sabemos, la varianza global de la variable es proporcional al promedio de los cuadrados de la distan- cia de cada valor respecto a su media, por lo que su nu- merador se conoce como suma total de cuadrados. Así, podemos entender una varianza como el cociente entre una suma de cuadrados y sus grados de libertad. Por tanto, la varianza total puede definirse como la suma de cuadrados total dividida por el número de grados de li- bertad, que son n – 1 ( n es el tamaño de la muestra total). Esta suma total de cuadrados puede descomponerse en los dos componentes ya referidos al hablar del valor de
RkJQdWJsaXNoZXIy MTAwMjkz