Medicina Basada en la Evidencia

Estadística básica – 628 – por la variable predictora. No se trata de una prueba para medir la bondad de ajuste propiamente dicha. Existen va- rios métodos de estimación basados en un cociente de la verosimilitud del modelo nulo con la constante sola (L0) y la del modelo que incorpora la variable predictora (LM). PseudoR 2 de Mc McFadden. Es poco utilizado: PseudoR 2 de Cox-Snell. Tiene el inconveniente que nun- ca toma el valor 1, aunque el modelo explique el 100% de la variabilidad de la variable de respuesta. Nos in- dica la proporción de varianza explicada por la variable predictora (independiente): donde n es el tamaño muestral PseudoR 2 de Nagelkerke. Corrige el caso anterior para que tome el valor 1 en el caso de que el modelo expli- que el 100% de la varianza. Es el más utilizado: Volvamos a nuestro ejemplo: Para obtener las PseudoR 2 , hay que recurrir a los co- mandos de sintaxis con la librería DescTools y la fun- ción PseudoR 2 . En la Tabla 6 vemos la secuencia de comandos y los resultados. Podemos observar cómo el modelo GLM.GEA explica el 10% de la varianza de la gea bacteriana (R2 Nagelkerke). La calidad de todo modelo de regresión logística debe ser evaluada: podemos estimar las desviaciones del modelo con y sin variables independientes, comparar los valores predichos observados y estimar los coeficientes de determinación Predicciones Una de las utilidades del modelo logístico es realizar pre- dicciones sobre la presencia o ausencia del suceso en la variable dependiente, siempre y cuando el diseño epide- miológico sea adecuado (longitudinal). En nuestro ejem- plo, podemos calcular la probabilidad de presentar gas- troenteritis bacteriana en presencia de sangre en heces. P (gea bacteriana/sangre en heces) = El modelo predice que en presencia de sangre en he- ces existe una probabilidad del 74% de presentar GEA bacteriana. RESUMEN Como resumen, podemos distinguir varias etapas en la RL: 1. Recodificar las variables independientes categóri- cas u ordinales y la variable dependiente en 0 y 1. 2. Ejecutar el modelo de Regresión logística, seleccio- nando la variable dependiente y la independiente, modelo binomial y función logit . Tabla 5. Tabla de contingencia de los valores observados y predichos e indicadores de validez diagnóstica Secuencia de comandos: install.packages(“blorr”) library(blorr) blr_confusion_matrix(GLM.GEA, cutoff = 0.5) Salida de resultados: Confusion Matrix and Statistics Reference Prediction 0 1 0 169 64 1 6 17 Accuracy : 0.7266 No Information Rate : 0.6836 Kappa : 0.2174 McNemars’s Test P-Value : 0.0000 Sensitivity : 0.2099 Specificity : 0.9657 Pos Pred Value : 0.7391 Neg Pred Value : 0.7253 Prevalence : 0.3164 Detection Rate : 0.0664 Detection Prevalence : 0.0898 Balanced Accuracy : 0.5878 Precision : 0.7391 Recall : 0.2099 ‘Positive’ Class : 1 Tabla 6. Estimación de los coeficientes de determinación Secuencia de comandos: install.packages(“DescTools”) Library(“DescTools”) PseudoR2(GLM.GEA, c(“McFadden”, “Nagel”,”CoxSnell”)) Salida de resultados: McFadden Nagelkerke CoxSnell 0.06011958 0.10140051 0.07229823

RkJQdWJsaXNoZXIy MTAwMjkz