Medicina Basada en la Evidencia

Análisis multivariante… – 665 – pretación de los resultados en función del método de codificación elegido. El tipo de codificación influirá en el sentido de los coeficientes y su interpretación. Más adelante veremos un ejemplo de ellas. 3. Elección de la estrategia de modelización La estrategia de modelización recoge el proceso de in- troducción y exclusión de variables en el modelo has- ta conseguir el modelo más simple que explique la relación entre variables (principio de parsimonia). Los resultados pueden cambiar si elaboramos primero un modelo con todas las variables y vamos extrayendo las que no muestran asociación ( Backward ), si empezamos con una variable y vamos añadiendo el resto ( Forward ), o bien si usamos estrategias de comprobación de todas las variables ya incluidas con la estrategia anterior al introducir una nueva ( Stepwise ). Asimismo, debemos definir qué criterio estadístico se emplea para ir com- parando los modelos a cada paso; puede ser un criterio vinculado a cada variable (cambios en los coeficientes o significación individual) o a la bondad del modelo global (por ej.: cambios en la F parcial para regresión lineal, cambios en la razón de verosimilitudes para re- gresión logística). 4. Evaluación de la fiabilidad del modelo Consiste en, una vez seleccionado el mejor modelo, comprobar si los datos predichos por él concuerdan con los datos observados en una nueva muestra de sujetos, obtenida de la misma población de la que se obtuvo la muestra original. Con frecuencia, esto resulta poco factible, por lo que se recurre a fraccionar la muestra original, estimar el modelo en una de las submuestras y contrastar su fiabilidad con los datos de la submues- tra restante. Existen diferentes medidas que se pueden aplicar para contrastar la fiabilidad del modelo, adap- tadas a cada tipo de análisis. Los pasos del proceso de modelización multivariante son: (a) elección del modelo máximo; (b) codificación de variables y elección de los valores de referencia; (c) elección de la estrategia de modelización; y (d) evaluación de la fiabilidad del modelo A continuación, mostraremos los pasos del análisis multivariante para la regresión lineal múltiple y para la regresión logística. Finalmente, mencionaremos otras técnicas de análisis multivariante. REGRESIÓN LINEAL MÚLTIPLE La regresión lineal múltiple es una extensión de la re- gresión lineal simple, descrita en un capítulo anterior. Se utiliza cuando queremos predecir el valor de una variable medida en una escala continua, de razones o intervalos, en función del valor de otras dos o más va- riables. La variable que queremos predecir es la varia- ble dependiente. La regresión lineal múltiple se utiliza para relacionar una variable dependiente medida en una escala continua, de razones o intervalos, con dos o más variables independientes. Sus requisitos son: linealidad, normalidad y homocedasticidad de los residuos, equilibrio entre número de casos y variables, ausencia de colinealidad y control de valores fuera de rango La regresión lineal múltiple tiene una serie de requisi- tos: linealidad (la relación entre las variables debe ser lineal), normalidad y homocedasticidad de los residuos (las diferencias entre los valores observados y los pre- dichos por el modelo deben seguir una distribución normal con varianzas iguales a lo largo de todos los va- lores de las variables), equilibrio entre número de ca- sos y variables (se requieren al menos 20 observaciones por cada variable incluida en el modelo), ausencia de colinealidad (debemos evitar introducir en el modelo variables independientes interrelacionadas) y control de valores fuera de rango (las observaciones con valo- res atípicos distorsionan los modelos). Los coeficientes de las variables independientes de una regresión lineal múltiple corresponden a la diferencia de medias de la variable dependiente por cada unidad de cambio de las variables independientes Como se mencionó en el capítulo 6.12 de regresión li- neal simple, la regresión lineal se basa en la correlación entre variables y se concreta en la fórmula de regresión que permite estimar el valor de la variable dependiente a partir del valor de la variable independiente. La regre- sión lineal múltiple es una extensión de la simple, en la que la estimación se realiza a partir de los valores de dos o más variables independientes. La ecuación general de la regresión lineal múltiple es de la forma: Y = a + b 1 X 1 + b 2 X 2 + …. + b m X m donde Y es el valor de la variable dependiente, a es la constante del modelo (equivale al valor de la variable dependiente cuando todas las independientes valen cero o cuando no hay efecto de las variables indepen- dientes sobre la dependiente), b i los coeficientes de cada variable independiente (equivalen al cambio de va- lor de Y por cada unidad de cambio de X i ) y X i sus valores.

RkJQdWJsaXNoZXIy MTAwMjkz