Medicina Basada en la Evidencia

Lectura crítica de documentos científicos – 438 – permite explorar la capacidad diagnóstica de una prue- ba en sus distintos valores son las curvas ROC (iniciales del término inglés original Receiver Operating Characte- ristics ), con las que podemos conocer su validez global y seleccionar el punto o puntos de corte más adecuados. Es preciso tener en cuenta que la información de que disponemos sobre la validez de las pruebas diagnósticas procede de estudios realizados en muestras de pobla- ción. Por lo tanto, las estimaciones obtenidas en dichos estudios están sujetas a variabilidad aleatoria (por lo que les son aplicables intervalos de confianza) y, si los estudios han sido diseñados incorrectamente, a sesgos. La fiabilidad de una prueba viene determinada por la es- tabilidad de sus mediciones cuando se repite en condicio- nes similares. La variabilidad de las mediciones va a estar influida por múltiples factores que interesa conocer y con- trolar. Entre ellos, tiene especial importancia distinguir las variaciones de interpretación intraobservador e interob- servador. La fiabilidad puede ser evaluada para resulta- dos discretos nominales mediante el índice kappa (IK), para resultados discretos ordinales mediante el IK ponde- rado y para resultados continuos mediante el coeficiente de correlación intraclase y el método de Bland-Altman. La fiabilidad de una prueba viene determinada por la estabilidad de sus mediciones cuando se repite en condiciones similares El IK nos ofrece una estimación del grado de acuerdo no debido al azar a partir de la proporción de acuerdo ob- servado (Po) y la proporción de acuerdo esperado (Pe) = Po-Pe/1-Pe. El IK puede adoptar valores entre -1 y + 1: es 1 si existe un acuerdo total, 0 si Po es igual a Pe y menor de 0 si Po es inferior a Pe por azar. La interpretación más aceptada de los rangos de valores del IK es: 0,81-1 = exce- lente; 0,61-0,80 = buena; 0,41-0,60 = moderada; 0,21-0,40 = ligera; ≤0,20 = mala. VALORACIÓN CRÍTICA DE ARTÍCULOS SOBRE PRUEBAS DIAGNÓSTICAS Siguiendo las recomendaciones del Evidence Based Medicine Working Group (EBMWG) analizaremos los tres pasos a seguir para analizar la validez, la importancia y la aplicabilidad de los artículos sobre pruebas diagnós- ticas. En cada paso deberemos responder a una seria de preguntas, según versión adaptada del grupo CASPe. 1. Analizar la VALIDEZ de las publicaciones sobre pruebas diagnósticas Cabe contestar a una serie de preguntas, clasificadas en criterios primarios (son preguntas de eliminación: si no se cumplen estos criterios primarios quizá no valga la pena continuar con la lectura) y secundarios (son preguntas más detalladas, que cabe realizar si se continúa con la lec- tura del artículo tras cumplir con los criterios primarios). Criterios principales ¿Existió una comparación ciega, independiente, con un patrón de referencia adecuado? Para saber si una prueba diagnóstica es útil sus resulta- dos deberían compararse con la “verdad” (presencia o ausencia de enfermedad), en la práctica con otra prue- ba que actúa como patrón de referencia ( gold standard ) reconocido por la comunidad científica (por contar con una validez contrastada o, al menos, aceptado por con- senso). Este patrón de referencia se debe aplicar a toda la serie de casos estudiados y no tiene que incorporar información procedente de la prueba diagnóstica que se evalúa (sesgo de incorporación: evitar que el resul- tado de una de las pruebas pueda influir sobre la inter- pretación de los resultados de la otra). Si no se puede aceptar el estándar de referencia dentro de lo razona- ble, es poco probable que el artículo proporcione resul- tados válidos para sus objetivos. En relación con el patrón de referencia, resulta también importante considerar si es capaz de clasificar el estado de enfermedad en todas las observaciones. En el caso de que existan observaciones con un diagnóstico inde- terminado, si estas son excluidas del análisis, se produ- cirán estimaciones sesgadas de las características ope- rativas de la prueba diagnóstica. Este sesgo, conocido como sesgo por exclusión de indeterminados, ocasiona habitualmente sobrestimaciones de la sensibilidad y de la especificidad ( Tabla 1 ). ¿Incluyó la muestra de pacientes a un espectro ade- cuado de pacientes a los cuales en la práctica clínica se aplicará la prueba diagnóstica? El valor real de una prueba diagnóstica solo se establece en un estudio que es lo más parecido a la práctica clíni- ca, por lo que es conveniente que incluya pacientes con sospecha de enfermedad, que incluyan sujetos enfermos (con distinta gravedad) y sanos. El artículo debe definir explícitamente los criterios de selección, ya que, si bien la sensibilidad y especificidad son relativamente constan- tes independientemente de la prevalencia de la enferme- dad, los valores predictivos y, por tanto, la utilidad de la prueba para el lector están muy influidos por ella. Criterios secundarios ¿Influyeron los resultados de la prueba diagnóstica en la decisión de realizar el patrón de referencia? Conviene evitar los sesgos de secuencia y de revisión. Evitar el sesgo de secuencia (verificación diagnóstica o verification bias ): el diseño del estudio debe tratar