Medicina Basada en la Evidencia
Regresión lineal simple… – 617 – Para terminar, realizamos la prueba de Durbin-Watson para autocorrelación para comprobar el supuesto de independencia. Obtenemos un valor del estadístico DW = 2,37, con valor de p = 0,14. En consecuencia, al ser p >0,05, no podemos rechazar la hipótesis nula de que los residuos son independientes, cumpliéndose así la última condición para considerar el modelo como válido. CALIDAD Y BONDAD DE AJUSTE DEL MODELO DE REGRESIÓN LINEAL Finalmente, valoraremos la distribución de los residuos, junto con algunos parámetros que nos indican la cali- dad y la bondad de ajuste del modelo, como el coefi- ciente de determinación. Volvamos al ejemplo anterior: Vemos que R nos ofrece, en primer lugar, la distribu- ción de los residuos ( Figura 3 ). Podemos ver cómo su mediana está próxima a cero (0,08) y cómo sus valo- res se distribuyen de forma uniforme entre los cuan- tiles primero y tercero. Esto es indicativo de que los residuos siguen una distribución normal. Además, el grado de dispersión alrededor de la mediana (el reco- rrido intercuartílico de los residuos) nos da una idea de la precisión del modelo. Por último, el coeficiente R 2 , o coeficiente de determi- nación, es otra medida importante de la bondad de ajuste del modelo. Este parámetro explica la varianza total del conjunto de datos que el modelo es capaz de explicar. Volvamos al ejemplo anterior: Podemos ver que R 2 tiene un valor de 0,38 ( Figura 3 ). Esto significa que el modelo que hemos elaborado ex- plica un 38% de la variabilidad que se observa en la variable dependiente, el índice de masa corporal es- tandarizado. Para terminar, hay que indicar que el programa que utilicemos para elaborar el modelo nos proporcionará un coeficiente de determinación ajustado, aunque este carece de aplicación en el caso de la regresión lineal simple. El coeficiente de determinación R 2 estima la proporción de la varianza total de la variable dependiente que puede ser explicada por el modelo de regresión Un inconveniente de R 2 es que su valor se ve magnifi- cado cuando aumenta el número de variables indepen- dientes o predictoras del modelo (en el caso de regre- sión lineal múltiple) aun a pesar de que las variables no sean muy informativas. Por este motivo, se calcula el llamado coeficiente de determinación ajustado, que es un estimador más conservador que el R 2 de la bondad de ajuste del modelo y que, además, puede servir para comparar la bondad de ajuste de modelos de diferente número de variables independientes o predictoras rea- lizados a partir de los mismos datos. Figura 5. Gráfico de comparación de cuantiles de los residuos con sus cuantiles teóricos bajo el supuesto de que se distribuyen de forma normal t Quantiles Studentized Residuals (RegModel.2) -2 -1 0 1 2 1 2 0 -1 -2 2 28
RkJQdWJsaXNoZXIy MTAwMjkz