Medicina Basada en la Evidencia
Estadística básica – 606 – 4. Correlación no paramétrica de los rangos de Spearman La correlación ordinal de Spearman es la alternativa a la correlación lineal de Pearson cuando no se cumple el supuesto de normalidad de las variables, el tamaño muestral es muy escaso o las variables son ordinales. La correlación de Pearson valora relaciones lineales, mientras que la de Spearman valora que la relación en- tre las variables sea monótona (de forma lineal o no, las dos variables aumentan o disminuyen en el mismo sentido y con una tendencia constante). Se representa por el coeficiente de correlación de Spe- arman (r s ) que es estimador del parámetro poblacio- nal ρ ( rho ). Nos mide la fuerza de asociación o relación entre dos variables sin presuponer direccionalidad entre ellas. A mayor valor absoluto, mayor correlación, siendo el 1 o -1 la correlación perfecta directa o inver- sa entre las variables, y el 0, como valor nulo, la no existencia de correlación. Al ser r una estimación del coeficiente poblacional ρ, la prueba de hipótesis se debe plantear sobre la probabilidad de independen- cia de las variables a nivel poblacional. Así tendremos que H 0 : ρ = 0 y H 1 : ρ ≠ 0. Volviendo a nuestra base de datos: Elegimos dos variables: la Edad y el IMC. Estamos inte- resados en conocer si existe correlación entre ambas. Comprobamos la normalidad de la distribución de ambas muestras ( Anexo 7 ). Obtenemos que el IMC no sigue una distribución normal ( p = 0,016). Sin embar- go, la Edad sí se puede aproximar a una distribución normal ( p = 0,09). En este caso, no es posible aplicar la correlación lineal de Pearson porque la distribución normal deber ser bivariada. Aplicamos entonces la co- rrelación ordinal de Spearman. En el Anexo 8 se puede ver cómo se realiza con RCom- mander. En la ventana de resultados presenta el coe- ficiente de correlación ρ = 0,32 y su significación esta- dística p = 0,37. La interpretación sería que existe una correlación mediana entre el IMC y la Edad; sin em- bargo, esta no es significativa. Es importante reseñar que solo con el valor del coeficiente de correlación no basta. Debemos realizar la prueba de hipótesis para obtener el nivel de significación, ya que nos podemos encontrar ante situaciones que pueden presentar co- rrelación y esta no ser significativa. RCommander no facilita el intervalo de confianza, pero se puede calcular fácilmente por el argumento “spearman.ci” del paquete RVAideMemoire de R, como se detalla en el siguiente script : >install (RVAideMemoire) >library (RVAideMemoire) >with(fundam_no_param, spearman.ci (Edad, IMC)) Obtenemos el IC 95 de ρ (-0,63 a 0,77). Como incluye el valor nulo (0) podemos concluir que no es signifi- cativo. 5. Pruebas no paramétricas para estudios con medidas repetidas En el caso de estudios pareados en los que se vulnera el supuesto de normalidad, la comparación de 2 muestras emparejadas se realiza mediante la prueba de los ran- gos con signo de Wilcoxon. Esta prueba sería la equi- valente a la t de Student para datos relacionados. Para estudios con más de 2 muestras, se usará la prueba de Friedman, equivalente no paramétrico del ANOVA con medidas repetidas. Los análisis se pueden realizar con RCommander. Desde la pestaña Estadísticos/Test no paramétricos/Test de Wilcoxon para pruebas pareadas, se calculará la prueba de los rangos con signo de Wilcoxon. Y desde Estadísti- cos/Test no paramétricos/Test de la suma de rangos de Friedman, la prueba de Friedman. Ambas pruebas se tratarán con más profundidad en el capítulo de pruebas para muestras relacionadas.
RkJQdWJsaXNoZXIy MTAwMjkz