Medicina Basada en la Evidencia

Estadística básica – 668 – tra original y los valores de los nuevos pacientes, lo que permitiría estimar nuevos R 2 ajustados. Si el nuevo R 2 fuera menor que el original, la fiabilidad del modelo quedaría cuestionada. REGRESIÓN LOGÍSTICA MÚLTIPLE La regresión logística múltiple es una técnica de análi- sis que utilizamos cuando se desea conocer la relación entre una variable dependiente cualitativa dicotómica y dos o más variables explicativas independientes, ya sean cualitativas o cuantitativas. Existen variantes de esta técnica para cuando la variable dependiente es nominal politómica, esto es, tiene más de dos catego- rías (regresión logística multinomial o politómica), y para cuando es ordinal (regresión logística ordinal). El objetivo de la regresión logística binaria no es, como en la regresión lineal, predecir el valor de la variable dependiente (Y) a partir de una o varias variables in- dependientes (X), sino predecir la probabilidad de que ocurra el evento que caracteriza la variable dependien- te (éxito, enfermedad, etc.), conocidos los valores de las variables independientes. La regresión logística múltiple permite conocer la relación entre una variable dependiente cualitativa dicotómica y dos o más variables explicativas independientes, ya sean cualitativas o cuantitativas La variable dependiente va a adoptar los valores 1 y 0 que representan, respectivamente, la presencia y au- sencia del evento que clasifica dicha variable. Para ex- plorar la contribución de las variables independientes a la estimación de la probabilidad de la variable depen- diente, tendríamos que construir un modelo similar al empleado en regresión lineal: a + b 1 X 1 + b 2 X 2 + …. + b m X m Como vimos en el capítulo de regresión logística simple, es necesario realizar una transformación de la ecuación (sustituir las probabilidades por sus odds y calcular sus logaritmos neperianos) para que el resultado adopte valores entre menos y más infinito. Con esta transformación ya podemos emplear una ecuación lineal. La fórmula de la regresión logística quedaría: Ln(p/[1-p]) = b 0 + b 1 X 1 + b 2 X 2 + ….+ b n X n De la que podemos calcular directamente las probabili- dades con la fórmula: 1 P(Y) = 1 + e – (b 0 + b 1 X 1 + b 2 X 2 + ….+ b n X n ) , donde P(Y) es la probabilidad de que Y adopte el valor 1 (éxito, enfermedad, etc.), b o es la constante del modelo, b i los coeficientes de cada variable independiente y X i sus valores. Las covariables cualitativas deben ser dicotómicas, to- mando valor 0 para su ausencia y 1 para su presencia. Si la covariable tuviera más de dos categorías debemos realizar una transformación de la misma en varias co- variables cualitativas dicotómicas ficticias (variables indicadoras o dummies ). Luego veremos un ejemplo. Al hacer esta transformación, cada categoría de la varia- ble entraría en el modelo de forma individual, aunque su modelización y análisis debe ser conjunto. Los coeficientes de las variables independientes de una regresión logística deben ser transformados para su interpretación. Exponenciando su valor (e b ) obtenemos las odds ratio ajustadas de cada variable Aunque las covariables cuantitativas pueden ser anali- zadas en su escala natural, no siempre el riesgo asocia- do a cada unidad de la variable alcanza la magnitud su- ficiente para mostrar significación clínica o estadística. Por ello, no es infrecuente tener que recodificar estas variables para que el modelo estime el riesgo asociado a determinados rangos o magnitudes de la variable. La interpretación de los coeficientes en la regresión lo- gística es distinta que la de los coeficientes de la re- gresión lineal; aquí se utilizan para calcular las odds ratio (OR) ajustadas de cada variable, que se obtienen exponenciando el coeficiente (e b ); el cálculo es propor- cionado habitualmente por los paquetes estadísticos. Esta OR equivale a la OR combinada que obtendríamos en un análisis estratificado. Veamos un ejemplo: Para ilustrar el procedimiento de la regresión logísti- ca vamos a realizar un análisis con los datos de una serie de casos de gastroenteritis aguda. Queremos construir un modelo para predecir la gastroenteritis bacteriana. En la Figura 4 se presentan las frecuencias de gastroenteritis bacteriana en función de algunas variables seleccionadas: presencia de sangre en he- ces, edad menor de 2 años y estación del año. Podemos observar que en presencia de sangre en he- ces es mucho más frecuente la gastroenteritis bacteria- na, que aparentemente no hay diferencias por edades, aunque el riesgo asociado a sangre en heces parece tener lugar principalmente en los menores de 2 años. Asimismo, observamos que en verano es mucho más frecuente la presencia de gastroenteritis bacteriana.

RkJQdWJsaXNoZXIy MTAwMjkz