Medicina Basada en la Evidencia

Estadística básica – 670 – que aumenta entre 2,25 y 12,97 veces. Aunque la pre- sencia de sangre en heces está muy asociada a la etiología bacteriana, en este análisis se ve que solo en los menores de dos años. Como se comentó en el documento previo de análisis estratificado, los aná- lisis deben darse por separado. En menores de dos años, el riesgo de tener bacterias en heces de los que tienen sangre en heces es 16,11 veces mayor que el de los que no la tienen; esta OR se calcula exponen- ciando la suma de los coeficientes de las variables Sangre en heces y la interacción (Exp[0,32 + 2,46]). 4. Evaluación de la fiabilidad del modelo. Una vez de- sarrollado el modelo, el siguiente paso es evaluar su fiabilidad, estimando las medidas de bondad de ajuste, medidas que informan del ajuste de los da- tos predichos por el modelo a los datos observados reales. En la Tabla 2 se presenta la salida corres- pondiente al modelo de la Figura 5 ; incluye la tabla de clasificación de valores predichos y observados, que muestra una concordancia del 73,83%, y las estimaciones de la desviación (-2 logaritmo de la razón de verosimilitudes, en inglés deviance ), y de los coeficientes de determinación R 2 (porcentaje de varianza explicada por el modelo). Ya comentamos para la regresión lineal múltiple la interpretación de R 2 , que corresponde al porcentaje de varianza explicada por el modelo, que interesa sea lo mayor posible. Sin embargo, para la desviación nos inte- resa el modelo que la tenga menor, porque será el que mejor ajusta a los datos. Otro estimador pro- porcionado en el análisis es el criterio de informa- ción de Akaike (AIC), que ajusta la log-verosimilitud por el número de variables; resulta muy útil cuando hay muchas variables independientes; el mejor mo- delo será el que tenga el AIC más bajo. Aunque alguna de las variables presentan contras- tes no significativos, no podemos prescindir de ellas, porque están vinculadas a otras variables indicadoras (primavera y otoño) o por sustentar el término de in- teracción (sangre en heces y edad menor de 2 años). Por ello, el modelo máximo elegido al inicio va a ser el modelo final. Los requisitos de una regresión logística múltiple son: la variable dependiente debe ser binaria y las observaciones, independientes entre sí; las variables independientes no deben tener colinealidad y si son métricas sus valores han de tener una relación lineal con los logaritmos de sus odds . También se requieren al menos 10 eventos del resultado principal por cada variable independiente Los modelos de regresión logística no tienen los reque- rimientos de los de regresión lineal. Así, no requieren que exista una relación lineal entre las variables depen- diente y las independientes, ni tampoco necesitan que haya normalidad ni homocedasticidad de los residuos. Sin embargo, sí requieren que la variable dependiente sea binaria (nominal dicotómica), que las observaciones sean independientes entre sí (no exista apareamiento o > GeaBact <- glm(gea_bac1_0 ~ hec_sang1_0 + Edad.2a + Edad2San + (Primav + Verano + Otoño), + family=binomial(logit), data=GeaPed2) > summary(GeaBact) Call: glm(formula = gea_bac1_0 ~ hec_sang1_0 + Edad.2a + Edad2San + (Primav + Verano + Otoño), family = binomial(logit), data = GeaPed2) Deviance Residuals: Min 1Q Median 3Q Max -2.0440 -0.7050 -0.6228 1.0836 1.9865 Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) -1.6683 0.4192 -3.980 0.00019 SangreHec 0.3249 0.8531 0.381 0.70333 Edad<2a -0.1552 0.3195 -0.486 0.62725 EdadxSangre 2.4617 1.1716 2.101 0.03563 Primav 0.4030 0.4497 0.896 0.37019 Verano 1.6511 0.4432 3.726 0.00019 Otoño 0.9937 0.5139 1.934 0.05314 --- Null deviance: 319.55 on 255 degrees of freedom Residual deviance: 274.60 on 249 degrees of freedom AIC: 288.6 > Confint(GeaBact, level=0.95, type=”Wald”, exponentiate=TRUE) Exponentiated Coefficients and Confidence Bounds Estimate 2.5 % 97.5 % (Intercept) 0.1885715 0.07839043 0.4106513 SangreHec 1.3838716 0.23648993 7.4770289 Edad<2a 0.8562749 0.45955103 1.6144831 Edad2San 11.7250573 1.28167439 142.0545209 Primav 1.4962438 0.63228828 3.7459178 Verano 5.2126068 2.25530941 12.9799053 Otoño 2.7013233 0.99141590 7.5647231 Figura 5. Regresión logística para predicción de gastroenteritis bacteriana Tabla 2. Medidas de ajuste del modelo de regresión logística GEA bacteriana Valor predicho Valor observado No Sí Porcentaje correcto No 172 3 98,29 Sí 64 17 20,99 Acierto global 73,83 -2 Log Verosimilitud 274,60 R cuadrada de Cox & Snell 0,16 R cuadrada de Nagelkerke 0,23 GEA: gastroenteritis aguda.