Medicina Basada en la Evidencia
Regresión lineal simple… – 615 – Calculemos ahora el modelo de regresión lineal. En la Figura 3 podemos ver los resultados proporcionados por R. En la cabecera de los resultados encontramos la fórmu- la del modelo elaborado. Aunque más adelante anali- zaremos el resto de los datos, nos fijaremos ahora en los coeficientes del modelo de regresión, el intercepto e IndCT, ambos estadísticamente significativos. Ya podemos escribir la recta de regresión, según la si- guiente ecuación: IMC_DS = -7,41 + 16,2xIndCT Vemos que, por cada unidad de aumento del índice cintura-talla, se producirá un aumento de 16,2 unida- des en el índice de masa corporal estandarizado. estadísticamente significativos podremos aplicar el modelo a nuestra población. Para ello, plantearemos un contraste de hipótesis para los dos coeficientes de la recta con la hipótesis nula de que su valor en la población es cero. Este contraste puede hacerse de dos formas: 1. Si dividimos cada coeficiente por su error estándar, obtendremos un estadístico que sigue una distribu- ción de la t de Student con n - 2 grados de libertad. Podemos calcular el valor de p asociado a ese valor y resolver el contraste de hipótesis rechazando la hipótesis nula si el valor de p <0,05. 2. Una forma un poco más compleja es fundamentar este contraste de hipótesis sobre un análisis de la varianza (ANOVA), considerando que la varianza de la variable dependiente se descompone en dos tér- minos: uno explicado por la variable independiente y otro no asignado a ninguna fuente y que se consi- dera no explicada (aleatoria). Podemos comparar estas dos varianzas utilizando una prueba de la F de Snedecor, con el que obtendremos el valor de su significación estadística. Volviendo al ejemplo anterior (Figura 3): En el apartado correspondiente a los coeficientes, po- demos ver sus valores estimados, el error estándar, el valor correspondiente a t (error estándar dividido entre los grados de libertad) y los valores de significa- ción estadística, ambos muy inferiores a 0,05. Al final de los resultados se muestra la significación global del modelo. El estadístico F tiene un valor de 34,21 con 1 y 56 grados de libertad, al que corresponde también un valor de p muy inferior a 0,05. DIAGNÓSTICO DEL MODELO DE REGRESIÓN Una vez comprobado que los coeficientes son significa- tivos, tendremos que comprobar que se cumplen una serie de supuestos necesarios para que el modelo sea válido. Es lo que se conoce como diagnóstico del mode- lo de regresión. Estos supuestos son cuatro: linealidad, homocedastici- dad, normalidad e independencia. 1. Supuesto de linealidad La relación entre la variable de predicción (indepen- diente) y de criterio (dependiente) debe ser lineal en el rango de valores observados de la variable de predic- ción. Una manera sencilla de comprobar este supuesto es la de representar un diagrama de dispersión y ver Figura 3. Resumen de los valores del modelo de regresión obtenido con el programa R En el Anexo 1 puede consultar los pasos necesarios para realizar este ejemplo con R y RCommander. La valoración completa de un modelo de regresión lineal incluye su significación estadística, su validación o diagnóstico y su calidad y bondad de ajuste a los datos proporcionados El análisis del modelo de regresión no finaliza con el cálcu- lo de los coeficientes de regresión. Es necesario valorar la significación estadística del modelo, validar que se cum- plen los requisitos necesarios para su utilización (diagnós- tico del modelo) y valorar su calidad y bondad de ajuste. SIGNIFICACIÓN DEL MODELO DE REGRESIÓN LINEAL Una vez estimados los coeficientes, debemos calcu- lar sus intervalos de confianza o su nivel de significa- ción estadística, ya que solo si ambos coeficientes son
RkJQdWJsaXNoZXIy MTAwMjkz