Medicina Basada en la Evidencia

Medidas epidemiológicas – 256 – ÁREA BAJO LA CURVA Un parámetro de interés en la curva ROC es el área bajo la curva (ABC) que nos permite evaluar varios aspectos. En primer lugar, representa el comportamiento global de la prueba diagnóstica , o sea, la probabilidad de que clasifique correctamente al paciente al que se le prac- tique dicha prueba, considerando todos los puntos de corte posibles. Una prueba ideal, con S y E del 100%, im- plica que siempre acierta y tiene un área bajo la curva de 1 (100% si se representa en porcentaje). Sin embargo, esta situación no suele verse en la práctica habitual. En la práctica clínica, una prueba cuya curva ROC tenga un ABC >0,9 se considera muy válida, entre 0,7-0,9 de validez moderada y entre 0,5-0,7 de validez baja. Así, la capaci- dad discriminatoria de la prueba disminuye al disminuir el ABC. Cuando la curva coincide con la diagonal, el ABC es igual a 0,5, lo que significa que la capacidad discri- minatoria es nula: obtendríamos la misma probabilidad de acertar realizando la prueba o tirando una moneda al aire. Valores por debajo de la diagonal (ABC <0,5) se corresponden con un error de clasificación de sanos y enfermos: la capacidad de la prueba es tan baja que toma a los sanos por enfermos, y viceversa. En la Figura 4 podemos ver ejemplos de curvas con distintas ABC. Demanera ideal, debemos obtener el intervalo de confian- za del ABC y comprobar que no incluya el valor 0,5, ya que en este caso la diferencia no sería estadísticamente signifi- cativa y la prueba no tendría mayor capacidad discrimina- toria que el azar. De manera alternativa, puede hacerse un contraste de hipótesis mediante el test de Mann-Whitney, que nos proporcionará el valor de p correspondiente. El problema es que estos procedimientos son matemática- mente complejos y no están al alcance de todos los pro- gramas de estadística habitualmente empleados. En una curva ROC, el área bajo la curva permite evaluar el comportamiento global de una prueba diagnóstica o comparar el rendimiento de dos o más curvas En segundo lugar, el ABC también se utiliza para compa- rar el rendimiento de dos o más pruebas diagnósticas ( Figura 5 ). En estos casos comparamos las curvas y el ABC de cada una. Aquella que tenga un ABC mayor será la que más validez diagnóstica tendrá. Así, lo correcto es calcular los intervalos de confianza del 95% y com- probar si existe solapamiento (en cuyo caso la validez de las dos pruebas será similar) o si uno es mayor que el otro (indicándonos cuál es la prueba más válida). La comparación de las curvas puede ser difícil en algunas ocasiones, por lo que existen métodos matemáticos para realizar los contrastes estadísticos y determinar si existe diferencia significativa entre las dos curvas. En cualquier caso, con independencia de la diferencia en las ABC de dos pruebas diagnósticas, la forma de las curvas puede darnos también información de interés. En la Figura 5 podemos ver superpuestas las curvas ROC de dos técnicas diagnósticas, A y B. Aunque la B tiene un ABC mayor y podría considerarse como una prueba diagnóstica más válida que A, podemos fijarnos en que, a valores muy bajos de S, la prueba A tiene un valor de E más alto que la B. De esta manera, si nos interesa maximizar S y E, escogeremos la prueba B, pero si lo que realmente nos interesa es un valor alto de E, quizás nos sea más interesante utilizar la prueba A. Figura 4. Ejemplos de curva ROC Discriminación perfecta (ABC = 1) Sensibilidad 1 Sensibilidad Sensibilidad ABC: 1 ABC: 0,8 ABC: 0,5 1-especificidad 1-especificidad 1-especificidad Buena discriminación (ABC = 0,8) No discriminatoria (ABC = 0,5) La prueba B es más potente (mayor área bajo la curva), pero puede observarse que la prueba A es más específica para valores bajos de sensibilidad. Figura 5. Comparación de curvas ROC 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% 100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% 1-especificidad A B Sensibilidad

RkJQdWJsaXNoZXIy MTAwMjkz