Medicina Basada en la Evidencia
Estadística básica – 532 – Siguiendo con nuestro ejemplo, a partir de esta estimación de probabilidad, podemos decir que cada uno de nues- tros adolescentes tiene una probabilidad de 0,18 (18%) de ser obeso. Utilizando terminología propia de la teoría de la probabilidad, cada adolescente es un experimento aleatorio , del que antes de explorarlo sabemos que puede o no ser obeso (posibles resultados del experimento) y la probabilidad de cualquiera de ellos (obeso p = 0,18), pero hasta que no lo exploramos no sabemos si lo es. Las variables se caracterizan por ser fruto de observacio- nes repetidas de una misma característica. Su informa- ción fundamental se puede resumir en un listado de los diversos resultados posibles y en la frecuencia (proba- bilidad) con que aparece cada uno de ellos. Lo habitual es que los posibles valores de una variable sigan algún tipo conocido de distribución de probabilidad , que es una función que describe las probabilidades de todos los posibles resultados de un experimento aleatorio. Una distribución de probabilidad es una función que describe los valores posibles de una variable y la probabilidad de que ocurra cada uno de ellos Existen muchas distribuciones de probabilidad, de las que posiblemente la más conocida sea la distribución normal, que siguen los valores de muchas variables continuas (por ej.: la talla de los adolescentes). Cuando los distintos valores de una variable siguen una distribución de probabilidad, la denominamos variable aleatoria . Para definir una variable aleatoria, necesita- mos conocer los valores posibles y la probabilidad de que ocurra cada uno de ellos. Veamos dos ejemplos: Variable aleatoria: “curación de un tipo de tumor”; va- lores posibles: sí/no, distribución de probabilidad: bi- nomial; probabilidad de curación: 0,75 (75%). Variable aleatoria: “longitud de los recién nacidos a término”; valores posibles: cualquier valor entre 40-60 cm; dis- tribución de probabilidad: normal con media 50 cm y desviación típica 2 cm. Variable aleatoria es aquella cuyos valores posibles siguen una determinada función de probabilidad Al elegir una variable, asumimos un tipo concreto de distribución de probabilidad, que condicionará las esti- maciones y contrastes de hipótesis que queramos rea- lizar con ella. A cada valor o rango de valores de una distribución de probabilidad le corresponde una pro- babilidad; esta relación se determina por lo que cono- cemos como función de probabilidad (también llamada función de masa para distribuciones discretas y función de densidad para distribuciones continuas). Existen múltiples distribuciones de probabilidad. Al- gunas ya han sido mencionadas, como la distribución binomial, para variables nominales dicotómicas, o la distribución normal, para variables continuas, pero hay muchas otras. Al final de este capítulo comentaremos brevemente algunas de las más utilizadas, pero, por su interés, abordaremos a continuación con más detalle las características de la distribución normal, ya que nos permitirá presentar la relación existente entre los valo- res de una distribución y su probabilidad. DISTRIBUCIÓN NORMAL La distribución normal (o gaussiana o acampanada) es la distribución continua más ampliamente utilizada. Constituye la piedra angular de la mayor parte de los métodos de estimación y contraste de hipótesis, por la asunción de que muchas variables aleatorias siguen una distribución normal. La distribución normal puede ser aplicada no solo a variables con distribución esencialmente normal, sino también a variables de distribución no normal adecua- damente transformadas o a estimaciones de paráme- tros poblacionales de otras variables aleatorias (por ejemplo, proporción de obesos) realizadas a partir de los datos de muestras con un tamaño suficiente (en función del teorema central del límite, n ≥30). La distribución normal tiene forma acampanada simétrica y puede definirse conociendo su media y su varianza. Entre la media menos y más 1,96 veces la desviación típica se encuentran el 95% de los valores La distribución normal viene caracterizada por su sime- tría, por su valor central (m, valor esperado, media o esperanza matemática) y por su dispersión (s², varian- za). Nos basta con conocer la media y la varianza para estimar la probabilidad de cualquier rango de valores. Así, sabemos que a cada lado de la media se sitúa el 50% de los valores, que entre la media menos y más una unidad de desviación típica (raíz cuadrada de la va- rianza) se encuentran el 68% de los valores y que entre la media menos y más 1,96 veces la desviación típica están el 95% de los valores ( Figura 1 ).
RkJQdWJsaXNoZXIy MTAwMjkz