Medicina Basada en la Evidencia

Regresión logística binaria simple… – 627 – Volvamos a nuestro ejemplo: Vimos anteriormente que en la salida de resultados de la Tabla 1 se mostraba la deviance del modelo solo con la constante, LL0 ( null deviance ) 319,55 y la deviance del modelo con la variable independiente LLB ( residual deviance ) 300,24. Ambos valores son me- diocres, ya que están alejados de 0, que sería el ajuste perfecto, pero existe una disminución del modelo LLB, lo que indica un mejor ajuste al introducir la variable sangre_heces en el modelo. Para conocer si la bondad de ajuste es significativa realizamos la prueba de bondad de ajuste global u ómnibus del modelo. En el Anexo 2 puede encontrar las instrucciones para hacer la prueba con RComman- der, que la ofrece bajo el nombre tabla ANOVA, por similitud con la F de la ANOVA de regresión lineal, pero con una prueba de χ 2. En la salida de resultados ( Tabla 3 ) vemos el valor de la prueba ( χ 2 = 19,12; gl = 1), que lleva asociada una significación muy alta ( p = 0,0000117). b) Contraste de bondad de ajuste al introducir las va- riables en el modelo. Para ello, empleamos la prue- ba de bondad de ajuste de Hosmer-Lemeshow. Esta prueba valora la concordancia que existe entre las probabilidades observadas en la muestra y las pre- dichas por el modelo, que sigue una distribución χ 2 . Bajo la hipótesis nula de que no existen diferencias entre ambas probabilidades, una p <0,05 concluye que rechazamos que exista una bondad de ajuste del modelo. Tiene el inconveniente de que cuando algún valor esperado es muy pequeño (<5) no se cal- cula el estadístico y toma el valor 0, pudiéndose con- cluir erróneamente que existe bondad de ajuste. Volvamos a nuestro ejemplo: Si queremos conocer la prueba de Bondad de ajuste global de Hosmer-Lemeshow, debemos hacerla me- diante sintaxis, ya que RCommander no la tiene im- plementada. Podemos usar la función “blr_test_hos- mer_lemeshow” de la librería blorr. En la Tabla 4 se muestra la sintaxis y los resultados. A diferencia del contraste de la Tabla 3 , en este interesa que no haya diferencias significativas. Así vemos que la probabili- dad de que las diferencias entre los valores predichos y observados se deba al azar es muy alta ( p = 1,0000), lo que indica buen ajuste del modelo. c) Estimación de los indicadores de validez de prue- bas diagnósticas. Este método parte de la idea de que un valor alto de la probabilidad predicha (>0,5) se asociará con un resultado de 1 en la variable dependiente y un valor bajo (<0,5) cercano al cero con el 0. Podríamos utilizar el modelo como clasi- ficación de una prueba diagnóstica, calculando su sensibilidad, especificidad y exactitud. Un valor de exactitud mayor del 75% nos diría que el modelo presenta un buen ajuste. Volvamos a nuestro ejemplo: Para poder calcular los indicadores de validez diag- nóstica del modelo debemos recurrir a una secuen- cia de comandos, porque RCommander no tiene im- plementada esta función en sus menús. En la Tabla 5 vemos la secuencia de comandos y los resultados de sensibilidad, especificidad y exactitud del modelo. Indicamos que todos los valores predichos mayores de 0,5 se clasifiquen como 1 (cp> (0,1). Aplicamos la función “blr_confusion_matrix” de la librería blorr ( Tabla 5 ). Como podemos ver, el modelo clasifica co- rrectamente al 72,6% de los valores ( Accuracy : 0,726; IC 95: 0,66 a 0,78) con una sensibilidad del 20% y una especificad del 96%. El modelo nos dice que la presen- cia de sangre en heces predice escasamente la diarrea bacteriana, su ausencia prácticamente la descarta. 2. Coeficientes de determinación. PseudoR 2 Para medir el grado de varianza explicada por el modelo ajustado, se han desarrollado métodos que por analogía con la R 2 de la regresión lineal se denominan genérica- mente PseudoR 2 . Este estimador toma valores entre 0 y 1; cuanto mayor es el valor, mayor es la varianza explicada Tabla 3. Análisis de las desviaciones (ver Anexo 4) Secuencia de comandos: Anova(GLM.GEA, type=”II”, test=”LR”) Salida de resultados: Analysis of Deviance Table (Type II tests) Response: gea_bac1_0 LR Df Pr(>Chisq) hec_sang 19.212 1 0.0000117 *** Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ‘ 1 Tabla 4. Prueba de Hosmer-Lemeshow de bondad de ajuste Secuencia de comandos: install.packages(“blorr”) library(blorr) blr_test_hosmer_lemeshow(GLM.GEA) Salida de resultados: Goodness of Fit Test Chi-Square DF Pr > ChiSq 0.0000 8 1.0000