Medicina Basada en la Evidencia
Regresión logística binaria simple… – 623 – L a regresión logística (RL) es una técnica estadística que permite relacionar una variable dependiente cualitativa (Y) con una o más variables indepen- dientes cuantitativas y/o cualitativas (X). Dependiendo del tipo de variable dependiente, tendremos la RL bi- naria (cualitativa dicotómica), la RL multinomial (cuali- tativa categórica, con más de dos categorías) y la RL or- dinal (cualitativa ordinal). En función de si las variables independientes son una o más de una, la regresión será simple o múltiple. En este capítulo nos centraremos en el modelo más sencillo, la RL simple binaria. FUNCIÓN LOGÍSTICA La RL actualmente, como todas las técnicas de regre- sión, está englobada dentro del modelo lineal generali- zado que responde a la fórmula: Función(y) = a + bx 1 + cx 2 + … + nx n + e Si la variable dependiente es categórica, Y = 0 sería au- sencia del carácter e Y = 1, presencia del mismo. A di- ferencia de la regresión lineal, que predice los valores medios que toma la variable dependiente, la RL predice probabilidades ( p ) de ocurrencia del suceso en función del valor que toman las variables independientes, sien- do sus valores desde 0 a 1. Matemáticamente, es posi- ble aplicar el modelo de regresión lineal de mínimos cuadrados, pero sus valores no serían creíbles, puesto que, para valores extremos del predictor, se obtienen valores de Y menores que 0 o mayores que 1. Esto con- tradice los valores que debe tomar una probabilidad (0,1). Para resolver este problema debemos buscar una función que transforme el valor devuelto por la regre- sión lineal en un resultado comprendido entre 0 y 1. Aunque hay varias funciones, la función logística o sig- moide ( Figura 1 ), que cumple estos requisitos, responde a la siguiente ecuación: OBJETIVOS: ■ Entender la utilidad e interpretación de la transformación logit en regresión logística ■ Conocer los requisitos de una regresión logística ■ Entender la estimación e interpretación de los coeficientes de las variables independientes en una regresión logística ■ Conocer e interpretar las medidas de bondad de ajuste y la capacidad predictiva de los modelos de regresión logística “Todos los modelos son aproximaciones. En esencia, todos son erróneos, pero algunos son útiles” George E. P. Box donde “z” es el valor de la regresión lineal a transfor- mar (para la RL: β 0 + β 1 x) y “e” es el número o constante de Euler (2,718). Si el valor de z es muy grande positivo e -z es aproxima- damente 0 y p(z) = 1. Si z es 0, e -z = 1 y p(z) = 0,5. Si z tiene un valor muy grande negativo, e -z es infinito y p(z) = 0. La regresión logística es una técnica estadística que permite relacionar una variable dependiente cualitativa con una o más variables independientes cuantitativas y/o cualitativas. Esta transformación nos permite clasificar el resultado de una fórmula de regresión lineal en probabilidades (de 0 a 1) del evento a predecir en la variable depen- diente. Como se puede ver en la Figura 1 , con la curva logística interpretamos valores de p(z) >0,5 como 1 o Figura 1. Función logística x Probabilidad acumulada -4 0 4 0,50 0,75 1,00 0,00 0,25 P(x) = 0,5 P(x) >0,5 P(x) <0,5
RkJQdWJsaXNoZXIy MTAwMjkz