Medicina Basada en la Evidencia
Estadística básica – 624 – presencia del evento y valores de p(z) <0,5 como 0 o au- sencia del mismo, siendo el p(z) = 0,5 el punto de corte. Despejando z en la ecuación logística tenemos: Si tomamos logaritmos neperianos (ln) a ambos lados de la igualdad tenemos: Al final, hemos conseguido expresar en logaritmo nepe- riano (ln) de odds el modelo lineal, mucho más sencillo de manejar, ya que sigue la distribución normal. A esta transformación se le llama logit . Para poder emplear ecuaciones lineales en estos modelos debemos hacer la transformación logit , que corresponde al logaritmo neperiano del cociente entre la probabilidad predicha y su complementario ( odds ) MODELO DE REGRESIÓN LOGÍSTICA Si tenemos una variable dependiente Y con resultado binario, que expresamos matemáticamente como 1 o 0 en función de la presencia o ausencia de la característi- ca definida por Y, la media de los valores de Y para cada posible valor de X sigue una función logística, expresa- da en la siguiente ecuación: Donde β 0 y β 1 son los coeficientes del modelo de regre- sión, “e” es el número o constante de Euler (2,718) y ε representa el error residual. Veamos a continuación los requisitos de aplicación de la RL, el procedimiento de estimación de parámetros y los métodos de valoración de la bondad de ajuste del modelo. Requisitos La RL es una técnica robusta y necesita pocos requisi- tos. Básicamente son: 1. La variable dependiente debe ser cualitativa (nomi- nal dicotómica). 2. Cuando haya variables independientes cuantitati- vas sus valores deben tener una relación lineal con los logaritmos de sus odds (probabilidad dividida por su complementario). 3. Las observaciones de la muestra deben ser inde- pendentes entre sí (que no exista apareamiento o medidas repetidas). 4. No debe existir colinealidad (cuando hay dos o más, asociación entre variables independientes). Veamos un ejemplo: Queremos conocer variables predictivas de etiología bacteriana (variable dependiente) en pacientes pediá- tricos con gastroenteritis aguda (GEA). En concreto, si la presencia de sangre en las heces (variable indepen- diente o predictiva) se asocia a etiología bacteriana. Hemos recopilado una base de datos con 256 casos que ingresaron con GEA. En ella, las variables dependiente e independiente han sido registradas como variables nominales con valores 1 o 0 en función de la presencia o ausencia (0 = no, 1 = sí) del atributo correspondiente (etiología bacteriana o sangre en heces). Hemos obser- vado que 17 de 81 casos con GEA bacteriana (21%) te- nían sangre en heces por tan solo 6 de 175 con GEA no bacteriana (3%). Parece que puede existir una relación entre sangre en heces y GEA bacteriana. Vemos que este análisis cumple los requisitos de una RL. Tenemos una variable dependiente cualitativa no- minal dicotómica, una sola variable independiente no cuantitativa (no hay que valorar si hay relación lineal) y las observaciones son independientes entre sí; ade- más, al haber una sola variable independiente no tie- ne sentido considerar la colinealidad Los requisitos de una regresión logística binaria son: una variable dependiente cualitativa nominal dicotómica, observaciones independientes entre sí, relación lineal de los valores de las variables independiente cuantitativas con los logaritmos de sus odds y ausencia de colinealidad entre variables independientes Estimación de los parámetros La estimación de los parámetros se realiza por el mé- todo de máxima verosimilitud, que consiste en calcular los valores de los coeficientes de regresión que dan a la muestra observada la máxima probabilidad posible. Este proceso es aproximado y se hace por varias iteraciones. Obviamos la explicación del proceso de estimación por exceder el objetivo de este capítulo. El lector interesado puede informarse en la bibliografía referenciada. Una vez estimados los coeficientes del modelo podremos utilizarlos para calcular las odds ratio (OR) correspon- dientes a cada variable, que se consigue exponenciando
RkJQdWJsaXNoZXIy MTAwMjkz