Ochoa Sangrador C. Valoración crítica de estudios sobre reglas de predicción clínica. Evid Pediatr. 2009;5:52
Introducción
Podemos definir la regla de predicción clínica (RPC) como una herramienta compuesta por un conjunto de variables de la historia clínica, exploración física y pruebas complementarias básicas, que nos estima la probabilidad de un evento, nos sugiere un diagnóstico o nos predice una respuesta concreta a un tratamiento1. Esta definición resulta igualmente aplicable para las denominadas “guías de predicción clínica” o “reglas de decisión clínica”. La “predicción” implica ayudar al médico a tomar la mejor decisión sobre un acontecimiento clínico futuro. La “decisión” implica dirigir al médico para que realice un tipo de acción específica, diagnóstica o terapéutica. La aplicación de las reglas de predicción clínica a veces deriva en una decisión y a veces en una predicción, pero a menudo también en una probabilidad o un cociente de probabilidades que el médico aplica al problema diagnóstico en cuestión. En este último caso, el término de “regla de diagnóstico clínico” o “guía de diagnóstico clínico” sería más preciso2.
En un artículo previo hemos revisado los fundamentos del diseño y evaluación de las RPC3. En él describimos cómo para diseñar una RPC deben seguirse varios pasos: 1) elegir el diagnóstico o evento a predecir y el escenario clínico o población en el que se quiere aplicar; 2) evaluar las variables predictivas en una muestra adecuada de pacientes, diseñando una RPC que recoja y pondere las variables finalmente válidas (derivación o diseño); 3) validar la RPC en una nueva muestra de pacientes similar a la de derivación, contrastando sus predicciones con el patrón de referencia que identifica el diagnóstico o evento de interés; y 4) aplicar la RPC en la práctica clínica examinando su rendimiento clínico.
Las RPC no pueden sustituir nuestra experiencia y conocimientos, sin embargo nos facilitan información estructurada sobre la capacidad predictiva de cada uno de los síntomas, signos y pruebas complementarias implicados en un determinado escenario clínico, y cómo combinarlos para cuantificar de forma precisa nuestras estimaciones diagnósticas y pronósticas.
En la práctica clínica, la información de la que disponemos para juzgar la validez y aplicabilidad de una RPC procederá de artículos científicos en los que se refleje su diseño o evaluación. Por ello, ante un escenario concreto en el que pensamos emplear una RPC tendremos que buscar estos artículos y, a través de su lectura crítica, juzgar la validez, importancia clínica y aplicabilidad de la RPC objeto de evaluación.
Búsqueda de estudios sobre RPC
Para buscar información sobre una RPC podemos explorar distintas bases de datos, tanto de publicaciones primarias como secundarias. En la búsqueda usaremos descriptores relacionados con la predicción clínica combinados con los de la enfermedad o evento que se trata de predecir. Lamentablemente, no existe un descriptor específico en el repertorio de descriptores (MeSH) de la base de datos MEDLINE de la National Library of Medicine. Se han usado diversas estrategias de búsqueda, en las que el descriptor más específico parece ser “Decision Support Techniques” y el término aislado más sensible “predict$”4. En la tabla 1 se detallan una serie de alternativas útiles.
Tabla 1. Búsquedas bibliográficas de estudios sobre reglas de predicción clínica Mostrar/ocultar.
Podemos encontrar artículos en los que se haya realizado el diseño, validación y análisis del impacto clínico de una RPC, sin embargo lo más frecuente es encontrar por separado estos estudios o a lo sumo estudios conjuntos de diseño y validación limitada.
Valoración crítica de estudios sobre RPC
Una vez encontrado el artículo o artículos debemos realizar una valoración de los mismos. Esta valoración va a resultar fundamental ya que a menudo la calidad de los trabajos publicados es deficiente, no se ajustan al escenario clínico que se trata de resolver, tienen errores metodológicos que comprometen los resultados o éstos son presentados de forma que limitan su correcta interpretación. Los fundamentos metodológicos de estos estudios han sido analizados en un artículo previo, en el que se justifican los criterios que a continuación repasaremos.
Diversos textos han analizado los estándares que deben cumplir estos estudios1,2,5,6. Seguiremos los pasos habitualmente propuestos por el Evidence Based Medicine Working Group2: ¿son válidos los resultados del estudio?, ¿cómo son los resultados?, ¿son aplicables a tu medio?
¿Son válidos los resultados del estudio?
El primer aspecto que hay que establecer es si la RPC responde a una pregunta claramente definida, en términos de población, diagnóstico o evento a predecir, variables predictivas consideradas y criterio de valoración de los resultados. Si alguno de estos elementos no están definidos o no se ajustan al escenario clínico que queremos resolver, el artículo que estamos valorando puede que no nos sea útil.
Debemos examinar las variables con potencial capacidad predictiva consideradas en el modelo (también las que han sido excluidas). Deben ser clínicamente importantes, fiables (precisión, reproducibilidad, concordancia intra e interobservador), estar definidas claramente y por adelantado. Además, el número de variables incluidas en la RPC no debe ser excesivo: para validar una RPC es conveniente una muestra con un número de eventos que supere 10 veces el número de variables predictivas, lo que evita fenómenos de sobreajuste.
La muestra que se emplee para diseñar la RPC debe ser representativa de la que será objeto de aplicación. Además, deben especificarse todas sus características, para facilitar la interpretación de la aplicabilidad de los resultados a otras poblaciones.
El resultado de interés de la predicción clínica debe ser válido: el diagnóstico o evento que trata de predecir la RPC debe ser relevante, estar claramente definido y ser medido con procedimientos adecuados. Si en un estudio el patrón de referencia clasifica incorrectamente o deja sin clasificar a un grupo de pacientes, los resultados no serán válidos.
Además, durante el proceso de desarrollo del modelo o su validación, las variables predictivas y el resultado que se trata de predecir deben ser recogidos de forma prospectiva e independiente (interesa que quien recoja las variables predictivas desconozca el resultado del patrón de referencia y viceversa).
Los métodos empleados en el diseño de la RPC deben ser explícitos y adecuados, detallando los procedimientos estadísticos empleados en el diseño de la RPC. Por último, para conocer la reproducibilidad y aplicabilidad de la RPC, los resultados deben ser validados en una población diferente de la utilizada para su diseño.
¿Cómo son los resultados?
Si el apartado anterior nos indica que el estudio es válido daremos un paso más, analizando los resultados. Comenzaremos fijándonos en el método empleado para categorizar a los pacientes (categorización). Los métodos más usados serán las escalas de puntuación, las fórmulas de regresión o los diagramas de flujo diseñados mediante partición reiterativa.
A continuación buscaremos los indicadores que describen la validez de la RPC. Los valores de sensibilidad, especificidad, valores predictivos, cocientes de probabilidades o áreas bajo la curva ROC nos informarán de cómo discrimina el diagnóstico o evento a predecir (discriminación). Si dichos estimadores no se han calculado, trataremos de calcularlos a partir de los resultados del estudio. Si bien es frecuente que los trabajos presenten las estimaciones de sensibilidad o especificidad, e incluso de los valores predictivos, pocos trabajos estiman los cocientes de probabilidades. El interés de estos estimadores radica en su utilidad para el cálculo de probabilidades ajustado a entornos con prevalencias distintas de las encontradas en los estudios de diseño o validación.
También buscaremos si en el estudio se ha calibrado la RPC, empleando alguna técnica que nos muestre cómo se ajustan el rango de predicciones del modelo a los datos reales. Habitualmente se representarán con métodos de bondad de ajuste, tablas o representaciones gráficas. Esto será especialmente importante cuando la predicción comprenda múltiples categorías o valores continuos.
Por último, considerando que todas las estimaciones se han hecho sobre muestras, tendremos que examinar la precisión de los resultados, si se presentan los intervalos de confianza, cómo es su amplitud, y, en los casos que no se presenten, si podemos calcularlos.
¿Son aplicables a tu medio?
Una vez evaluada la validez de los resultados y su magnitud, tenemos que juzgar su reproducibilidad, factibilidad y aplicabilidad. Si una RPC ha sido validada en varias muestras de pacientes de entornos clínicos diferentes con buenos resultados, la podremos considerar generalizable y reproducible. Para juzgar la aplicabilidad de la RPC tendremos en cuenta si los pacientes incluidos en las muestras de derivación y validación son similares a nuestros pacientes (mirar criterios de inclusión y exclusión). Asimismo, nos interesa valorar la factibilidad de la RPC. Algunos modelos predictivos requieren cálculos complejos, especialmente aquellos que usan ecuaciones de regresión, o información clínica que por limitaciones de medios o tiempo no podemos recoger en nuestra práctica clínica.
Por último, tendremos que valorar el impacto clínico de la RPC. Ya hemos comentado anteriormente que es excepcional encontrar trabajos en los que se evalúe el rendimiento clínico con variables de resultados como: duración de la enfermedad, incidencia de complicaciones, supervivencia, costes, etc. Por ello, el rendimiento clínico ha de ser muchas veces estimado de forma indirecta, considerando si los resultados de la RPC modificarán el manejo de nuestros pacientes, con cambios en la indicación de procedimientos diagnósticos o terapéuticos, si influirán en su pronóstico o evolución, si los errores de la predicción (falsos positivos o negativos) tienen consecuencias potencialmente graves, y si su uso afectará al consumo de recursos o costes. La ponderación global de costes y beneficios deberá hacerse tanto desde la perspectiva del médico, como del paciente, el sistema sanitario y la sociedad.
Existen diversas herramientas que facilitan los pasos anteriormente mencionados. En la tabla 2 se presenta una versión modificada de las preguntas elaboradas por el grupo CASPe como ayuda para la valoración crítica de estudios sobre RPC, inspiradas en la propuesta del Evidence Based Medicine Working Group2.
Tabla 2. Preguntas y pistas para entender las reglas de predicción clínica Mostrar/ocultar.
Criterios de calidad. Niveles de evidencia.
Como resultado de la valoración crítica, si la RPC es válida, sus resultados tienen importancia clínica y son aplicables a nuestro medio, decidiremos su implantación en nuestra práctica clínica o su incorporación a guías de práctica clínica. Para este supuesto nos va a interesar disponer de algún sistema de jerarquización de la calidad de la evidencia que sustenta la RPC.
En la tabla 3 resumimos los requerimientos metodológicos de los estudios de evaluación de RPC, presentados como criterios de calidad. Estos criterios serían aplicables a la valoración de trabajos en los que se hace el diseño y validación de una RPC. Si el trabajo aborda exclusivamente una de las fases, diseño o validación, los criterios requieren una lectura adaptada. Para estudios en los que se evalúa el rendimiento o impacto clínico de la aplicación de la guía, los criterios de calidad dependerán del diseño elegido en el estudio (ej. ensayo clínico, estudio de cohortes, etc.).
Tabla 3. Criterios de calidad metodológica de estudios de evaluación de reglas de predicción clínica Mostrar/ocultar.
Algunos autores han hecho revisiones metodológicas de estudios de diseño o validación de RPC, analizando su calidad metodológica y el grado de cumplimiento de los estándares propuestos1,5,7. Las principales deficiencias encontradas son: la ausencia de enmascaramiento o independencia en la recogida de información, la no valoración de la precisión o reproducibilidad de las variables predictivas, el uso de muestras que no representan el espectro habitual de pacientes, la falta de estudios de validación y la no valoración del impacto clínico de la aplicación de las RPC. Otros problemas menos frecuentes son: limitaciones en la definición de las variables predictivas o del patrón de referencia, en el grado de descripción de las muestras empleadas o en los métodos estadísticos empleados.
En función del grado de desarrollo alcanzado por una RPC podremos calificar el nivel de evidencia que la apoya. En la tabla 4 se presenta el sistema de jerarquización de la evidencia, propuesto por el Evidence-Based Medicine Working Group2. Sobre esta base, Seilly et al7 proponen un nivel superior suplementario en el que entrarían RPC que han mostrado su impacto clínico en estudios realizados en diferentes entornos, mejorando las decisiones médicas en un amplio espectro de pacientes.
Tabla 4. Jerarquía de evidencias para las reglas de predicción clínica Mostrar/ocultar.
Ochoa Sangrador C. Valoración crítica de estudios sobre reglas de predicción clínica. Evid Pediatr. 2009;5:52