Medicina Basada en la Evidencia

Estadística básica – 666 – Para variables nominales dicotómicas el coeficiente se interpreta como la diferencia de medias de la variable dependiente para cada categoría de la variable inde- pendiente (en igualdad del resto de variables indepen- dientes). Los modelos calculan los errores estándar de cada coeficiente, a partir de los cuales obtenemos los intervalos de confianza. La estimación de los coeficien- tes resulta más compleja que la empleada con la re- gresión lineal simple, pero se sustenta en los mismos principios. Veamos un ejemplo: Para ilustrar el procedimiento de modelización em- plearemos los datos de un estudio sobre factores pre- dictivos de gastroenteritis bacteriana. En la Figura 2 se presenta el diagrama de dispersión, del peso estanda- rizado (Zscore_Peso) en función de la edad de los pa- cientes, diferenciando los puntos en función del sexo. A la izquierda se presenta con la línea de regresión global y a la derecha por subgrupos de sexo. La fórmula insertada en cada gráfica nos permite es- timar para cada edad el peso estandarizado. Vemos que por cada año aumenta el peso 0,09 desviaciones estándar; la interpretación natural es que los niños más pequeños tienen más afectación ponderal que los mayores. Si queremos mejorar la predicción in- corporando al modelo el sexo, vemos que tanto las constantes (a: 0,72 para niños y 0,67 para niñas), como los coeficientes de la regresión (b: 0,12 para niños y 0,07 para niñas) son diferentes. Sumando las diferen- cias de constantes y coeficientes podemos estimar la diferencia de peso estandarizado entre sexos, ajusta- da por edad; en nuestro ejercicio, aproximadamente 0,10 desviaciones estándar (0,72-0,67+0,12-0,07). Ade- más del sexo, nos puede interesar estimar el efecto de otras variables en el peso, por ejemplo, la frecuencia de deposiciones. Si añadimos nuevas variables inde- pendientes la representación gráfica, necesariamente multidimensional, es más compleja, por lo que pres- cindiremos de ella. Veamos a continuación los pasos de la modelización: 1. Elección del modelomáximo. El primer paso será ele- gir las variables independientes que entrarán en el análisis. En función de nuestro conocimiento previo de la enfermedad a estudiar y del comportamiento de los datos en análisis previos, hemos decidido in- cluir en el modelo tres variables independientes: la edad, el sexo y la frecuencia de deposiciones. 2. Codificación de variables y elección de los valores de referencia. La variable edad se procesará con sus valores originales, considerando la unidad el año. Para poder operar con la variable sexo hemos recodificado los valores originales de la variable (1 masculino, 2 femenino) en nuevos valores que van a facilitar la interpretación de las estimaciones: 1 sexo masculino, 0 sexo femenino; de esta manera, los coeficientes estimados para esta variable mos- trarán la diferencia de peso estandarizado de los niños respecto a las niñas. Para la tercera variable, número de deposiciones, como es una variable ordinal, que no garantiza el supuesto de relación lineal, la simplificamos recodificándola como dico- tómica: más de 3 deposiciones al día (1) o menos (0); de esta manera, los coeficientes expresarán la diferencia de peso de los que tienen 3 o más depo- siciones respecto al resto. Figura 2. Diagramas de dispersión del peso estandarizado y la edad, con las rectas de regresión global y separadas por sexos

RkJQdWJsaXNoZXIy MTAwMjkz