Medicina Basada en la Evidencia

Regresión logística binaria simple… – 625 – los coeficientes (e β ), que expresan el riesgo de la variable dependiente asociado a la variable independiente. Además de las estimaciones de los coeficientes del mo- delo, los paquetes estadísticos calculan otros estima- dores, como el criterio de información de Akaike (AIC). Este estimador depende de la calidad del modelo, pero también del número de términos independientes. No permite cuantificar la calidad en términos absolutos, pero sí comparar modelos. El mejor será el que tenga el menor AIC. A la hora de interpretar los coeficientes y sus valores ex- ponenciados, como estos parámetros están estimados a partir de muestras, debemos calcular sus intervalos de confianza. Para las OR, si su intervalo de confianza no comprende el valor nulo, que es 1, podemos asumir que la variable se asocia a mayor (OR >1) o menor riesgo (OR <1) del evento que define la variable dependiente. Volvamos a nuestro ejemplo: Vamos a ver el procedimiento de estimación de los parámetros. Para ello, emplearemos esta base de datos que ana- lizaremos con el programa de acceso libre R ( https:// www.r-project.org/ ) , con el plugin RCommander. En el Anexo 1 puede encontrar las instrucciones para obtener el análisis del modelo de regresión logística ( Tabla 1 ). En la ventana de salida de datos ( Tabla 1 ) R nos mues- tra en primer lugar la fórmula utilizada para hacer la regresión, función glm, la variable dependiente prime- ro y la independiente después, la distribución (bino- mial), la función ( logit ) y la base de datos. Posterior- mente, los residuos de las desviaciones del modelo ( deviance residuals ) por cuantiles, interpretadas como la contribución de cada dato a la desviación total ( de- viance total ). En segundo lugar, los coeficientes de re- gresión ( coeficcients ), el termino constante β_0 ( Inter- cept ), y la variable independiente β_1 (hec_sang), con la categoría analizada presencia de sangre en heces (T.si) . De izquierda a derecha, tenemos el valor pun- tual estimado (2,01) que, al ser positivo, nos dice que existe una relación positiva, el error estándar (0,49), la prueba de significación de Wald (z, 4,049), que en este caso se ha realizado por aproximación a la normal, al ser un tamaño muestral suficientemente grande y, por último, el nivel de significación ( p = 0.00005); el pro- grama nos señala con tres asteriscos una p <0,0001. Posteriormente, R nos muestra las desviaciones del modelo y el criterio de información de AIC, que nos serviría para comparar con otros modelos alternativos. Tabla 1. Modelo de regresión logística (ver Anexo 2) Secuencia de comandos: GLM.GEA <- glm(gea_bac ~ hec_sang, family=binomial(logit), data=GeaPed) summary(GLM.GEA) Salida de resultados: Call: glm(formula = gea_bac ~ hec_sang, family = binomial(logit), data = GeaPed) Deviance Residuals: Min 1Q Median 3Q Max -1.6394 -0.8014 -0.8014 0.9850 1.6076 Coefficients: Estimate Std Error z value Pr(>|z|) (Intercept) -0.9710 0.1468 -6.616 3.70e-11 *** hec_sang [T.si] 2.0125 0.4970 4.049 5.14e-05 *** Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ‘ 1 (Dispersion parameter for binomial family taken to be 1) Null deviance: 319.55 on 255 degrees of freedom Residual deviance: 300.34 on 254 degrees of freedom AIC: 304.34 Number of Fisher Scoring iterations: 4 > exp(coef(GLM.GEA)) # Exponentiated coefficients (“odds ratios”) (Intercept) hec_sang [T.si] 0.3786982 7.4817708

RkJQdWJsaXNoZXIy MTAwMjkz