University of York. Centre for Reviews and Dissemination (CRD). Database of Abstracts of Reviews of Effects (DARE). Copyright 2006. University of York. Traducción autorizada
Los autores del documento original no se hacen responsables de los posibles errores que hayan podido cometerse en la traducción del mismo.
Revisores del CRD. URl del original en inglés disponible en: http://www.crd.york.ac.uk/CRDWeb/ShowRecord.asp?View=Full&ID=12007001290
Título: Precisión diagnóstica de la calprotectina fecal en la enfermedad inflamatoria intestinal y en el cáncer colorectal. von Roon A C, Karamountzos L, Purkayastha S, Reese G E, Darzi A W, Teare J P, Paraskeva P, Tekkis P P.
Origen: American Journal of Gastroenterology.
Año de publicación: 2007
Volumen: 102 (4)
Páginas: 803-813
Esta revisión encontró que la calprotectina fecal puede discriminar entre pacientes (adultos y niños) con y sin enfermedad inflamatoria intestinal, pero no es un test adecuado para el cribado general de cancer colorectal. Las conclusiones de los autores están basadas en los datos obtenidos, pero puede que no sean fiables debido a limitaciones de la revisión en la búsqueda, calidad de la valoración y variaciones entre los estudios primarios.
Tipo de documento: es un resumen estructurado escrito por revisores del CRD. El original reune una serie de criterios de calidad. Desde Sepriembre de 1996 los resúmenes se envian a los autores para su comentario. Se incorpora información adicional si procede. Se anota como [A:...].
Objetivo de los autores: determinar la exactitud de la calprotectina fecal (CF) en el diagnóstico de la enfermedad inflamatoria intestinal (EII) y del cáncer colorectal (CCR) en adultos y niños.
Intervenciones específicas incluidas en la revisión: se seleccionaron para su inclusión estudios sobre CF. Se excluyeron los estudios que medían la CF después de tratamientos médicos, dietéticos o quirúrgicos, así como los estudios histológicos. También se excluyeron los estudios que valoraban aspectos técnicos del análisis de la calprotectina. Los estudios incluidos evaluaban tanto los análisis antiguos como nuevos de CF. Los umbrales valorados en los estudios incluidos fueron 18,6; 30; 31,5; 50; 90; 100; 150 o 250 microg/g.
Estándar de referencia frente al cual se comparó la prueba diagnóstica: se seleccionaron para su inclusión los estudios que incluían como estándar de refrencia el diagnóstico histológico de enfermedad de Crohn (EC), colitis ulcerosa (CU) o CCR. También se seleccionaron los estudios que incluían gammagrafías con leucocitos radiomarcados o clínica de EC y CU como estándar de referencia.
Participantes incluidos en la revisión: se incluyeron tanto estudios de adultos como de niños. Se excluyeron los estudios en neonatos. Los estudios incluian pacientes con sospecha de EII, EII crónica conocida, EII en remisión clínica, síndrome del colon irritable (SCI), CU, EC, EII activa, estreñimiento, otros diagnósticos o síntomas gastrointestinales, diarrea crónica o cáncer colorectal conocido, pacientes asintomáticos, parientes o cónyuges de pacientes con EC o CCR, pacientes sometidos a cribado para cáncer colorectal, y pacientes derivados para colonoscopia, endoscopia digestiva alta o baja, o gammagrafía con leucocitos radiomarcados.
Resultados valorados en la revisión: los criterios de inclusión no fueron definidos en función de los resultados. Los resultados expuestos en la revisión fueron la sensibilidad, especificidad, oportunidad relativa (OR) del diagnóstico y área bajo la curva ROC para el diagnóstico de EC, CU y neoplasias colorectales. También se exponen las medias ponderadas de las diferencias en los niveles de CF entre los diferentes grupos diagnósticos.
Diseño de los estudios incluidos en la revisión: se excluyeron los estudios que no incluían un grupo control. Se incluyeron tanto los estudios de cohortes como los estudios de casos y controles. Se incluyeron tanto los estudios prospectivos como retrospectivos.
¿En que fuentes se realizó la búsqueda para identificar los estudios primarios?: se buscó en MEDLINE, EMBASE y la Cochrane Library desde su inicio hasta marzo de 2006; se informaron los términos de búsqueda. No se aplicaron restricciones de idioma. Se identificaron estudios adicionales a través de la función “related articles” (no se especifica la base de datos).
Análisis de la validez: se utilizó QUADAS (quality assessment for studies of diagnostic accuracy) para la valoración de la calidad del estudio. Se asignó una puntuación de 1 a los estudios si el criterio se cumplía, 0 si era dudoso, y -1 si no se cumplía. Los autores no especificaron cuantos revisores realizaron la evaluación de la validez.
¿Como se tomaron las decisiones sobre la pertinencia de los estudios primarios?: los autores no especificaron cómo se seleccionaron los estudios para la revisión, o cuántos revisores realizaron la selección.
¿Cómo se obtuvieron los datos de los estudios primarios?: dos revisores, independientemente, extrajeron los datos; los desacuerdos se resolvieron a través de un tercer revisor. Se introdujo una nueva técnica de análisis de la CF en 2000. Para permitir la comparación de los resultados obtenidos con la antigua técnica, con los de la nueva, los valores de CF obtenidos en los estudios que utilizaban la técnica primera se multiplicaron por cinco. Los datos se anotaron en una tabla de 2 x 2 y se ultilizaron para estimar la sensibilidad y la especificidad en varios puntos de corte. Se calculó la diferencia media entre los niveles de CF de los diferentes diagnósticos.
Número de estudios incluidos en la revisión: se incluyeron treinta estudios. Se incluyeron un total de 5.983 pacientes: 663 con EC, 361 con CU, 186 con EII, 297 con CCR, 697 con SCI y 3.393 controles sanos.
¿Como se agruparon los estudios?: las diferencias de sensibilidad, especificidad y medias ponderadas, agrupadas, se calcularon con modelos de efectos aleatorios. Se llevó a cabo un análisis de curvas ROC para valorar la correlación entre sensibilidad y especificidad, y se calculó el área bajo la curva ROC. Se calculó la OR del diagnóstico a partir de los datos de sensibilidad y especificidad. Se evaluó el sesgo de publicación utilizando un gráfico de embudo (funnel plot) de la diferencia de las medias poderadas.
¿Como se investigaron las diferencias entre los estudios?: la heterogeneidad se valoró estadísticamente utilizando el estadístico Q. Se utilizaron el análisis de subgrupos y la meta-regresión ponderada para valorar la diferencia en la precisión de la CF entre adultos y niños, y para comparar dos puntos de corte para la positividad (50 y 100 microg/g). Se llevó a cabo un análisis de sensibilidad para investigar los efectos de la calidad (puntuación QUADAS > 11) y el tamaño de la muestra (>100 pacientes) sobre las estimaciones de la sensibilidad, especificidad y de la OR del diagnóstico.
El rango del resumen de las puntuaciones de la calidad eran de 10 a 13. No se informaron los resultados de la valoración individual de la calidad.
Todos los resultados que se detallan mas abajo se refieren a un punto de corte de CF de 50 microg/g salvo que se especifique algo distinto.
EII comparado con no EII (9 estudios, 1.267 pacientes): la sensibilidad agrupada y la especificidad agrupada fueron 89% (intervalo de confianza 95%, IC: 86, 91) y 81% (IC 95%: 78, 84), respectivamente. Había fuerte evidencia de heterogeneidad (p< 0,001). La sensibilidad y especificidad agrupadas fueron ambas mayores para el punto de corte de 100 microg/g pero sólo 4 estudios midieron este umbral.
EC comparado con controles normales y SCI (5 estudios, 733 pacientes): la sensibilidad agrupada y la especificidad agrupada fueron 95% (IC 95%: 92,07) y 84% (IC 95%: 80, 87), respectivamente. Había cierta evidencia de heterogeneidad estadística (p = 0,07). Tanto la sensibilidad como la especificidad fueron mayores para el punto de corte de 100 microg/g pero sólo 2 estudios, ambos en niños, midieron este punto de corte.
CU comparado con controles normales y SCI (2 estudios, 235 pacientes): la sensibilidad agrupada y la especificidad agrupada fueron 78% (IC 95%: 69, 86) y 78% (IC 95%: 70, 84), respectivamente. No hubo evidencia de heterogeneidad estadística (p = 0,44).
CCR y adenoma comparado con ausencia de neoplasia, incluyendo inflamación (7 estudios, 4.112 pacientes): la sensibilidad agrupada y la especificidad agrupada fueron 36% (IC 95%: 34, 39) y 71% (IC 95%: 70, 73), respectivamente. Había fuerte evidencia de heterogeneidad (p< 0,001).
Adenoma versus ausencia de neoplasia, excluyendo inflamación (3 estudios, 547 pacientes): la sensibilidad agrupada y la especificidad agrupada fueron 52% (IC 95%: 42, 61) y 77% (IC 95%: 73, 81), respectivamente. Había fuerte evidencia de heterogeneidad estadística (p< 0,001). La sensibilidad fue mas baja y la especificidad mas alta en los estudios que utilizaron el punto de corte de 100 microg/g.
CCR versus ausencia de neoplasia, excluyendo inflamación (4 estudios, 2.025 pacientes): la sensibilidad agrupada y la especificidad agrupada fueron 87% (IC 95%: 77, 94) y 76% (IC 95%: 74, 78) respectivamente. Había fuerte evidencia de heterogeneidad estadística (p = 0,007).
La exclusión de los estudios de baja calidad aumentó la sensibilidad y, o bien no tuvo efecto en la especificidad, o disminuyó la especificidad. La restricción a estudios grandes tuvo un efecto similar. Ninguna de las variables medidas en el análisis de meta-regresión mostró una asociación significativa con la OR del diagnóstico.
El gráfico de embudo sugería que no hubo sesgo de publicación
¿Se informó sobre los costes de la revisión?: no.
Conclusiones de los autores:
La CF tiene la potencialidad de discriminar entre pacientes (tanto adultos como niños) con y sin EII. La precisión de la CF parece mejor para el punto de corte de 100 microg/g que para el punto de corte de 50 microg/g. La CF no es una buena prueba para el cribado general del CCR.
La revisión estudiaba una pregunta concreta que fue apoyada por los criterios de inclusión definidos. Se emprendió una búsqueda razonable de la bibliografía, a pesar de que no se hicieron intentos para identificar estudios no publicados. La revisión puede por tanto presentar sesgo de publicación, aunque este tema se valoró y se descartó en la revisión. Se llevó a cabo una valoración adecuada de la calidad, pero no se informaron los resultados de la calidad individuales, calculándose en su lugar una puntuación global de la calidad . Esta es la única información en relación a la valoración de la calidad, por lo tanto no es posible comentar la validez de los estudios incluidos. Los autores informaron que la extracción de los datos se realizó independientemente, evitando así sesgos en esta fase de la revisión, pero no hay información sobre si se dieron los pasos adecuados para evitar sesgos en otras fases del proceso de la revisión.
No se discutieron en detalle los métodos usados para agrupar los estudios, por lo que no es posible determinar si fueron los adecuados. Los estimadores de la precisión agrupados presentados, deben interpretarse con precaución debido a la heterogeneidad de los estimadores de los estudios individuales. En concreto, los estimadores agrupados basados en un pequeño número de estudios heterogéneos deben ser interpretados con precaución extrema. Tampoco está claro si algunas de las diferencias expuestas por los autores, en particular en relación con el punto de corte de la CF, reflejan las diferencias reales en su precisión o el resultado de la heterogeneidad entre los estudios. Las conclusiones de los autores están generalmente sustentadas en los datos pero deben interpretarse con cierto grado de precaución, especialmente las que se refieren al mayor grado de precisión del punto de corte de 100 microg/g.
¿Cuales son las consecuencias de la revisión?:
Consecuencias para la práctica clínica: los autores afirman que la CF no se puede recomendar como una herramienta de cribado para el CCR. La CF tiene la posibilidad de ser una prueba no invasiva para monitorizar la actividad de la enfermedad en la EII.
Consecuencias para futuras investigaciones: los autores afirman que son necesarios estudios prospectivos dirigidos a una sola pregunta y que informen de la precisión de la CF en distintos puntos de corte.
Índice de descriptores: asignación por la NLM
Descriptores: Biological-Markers/an [analysis]; Colorectal-Neoplasms/di [diagnosis]; Feces/ch [chemistry]; Inflammatory-Bowel-Diseases/di [diagnosis]; Leukocyte-L1-Antigen-Complex/an [analysis]; Predictive-Value-of-Tests; Reference-Values; Regression-Analysis; Sensitivity-and-Specificity
Número del registro de entrada: 12007001290
Fecha de entrada en la base de datos: 29 de febrero de 2008
Idioma de la revisión: Inglés.
Dirección para correspondencia con los autores de la revisión original: Dr. P P Tekkis, Department of Biosurgery and Surgical Technology, Imperial College, 10th Floor QEQM Wing, St. Mary's Hospital, Praed Street, London W2 1NY, UK. Correo electrónico: p.tekkis@imperial.ac.uk
Vínculo para acceder a la referencia de la revisión en Pubmed: 17324124
Esparza MJ. Precisión diagnóstica de la calprotectina fecal en la enfermedad inflamatoria intestinal y en el cáncer colorectal. Evid Pediatr. 2008;4:44. Traducción autorizada de: von Roon A C, Karamountzos L, Purkayastha S, Reese G E, Darzi A W, Teare J P, Paraskeva P, Tekkis P P. Diagnostic precision of fecal calprotectin for inflammatory bowel disease and colorectal malignancy. Am J Gastroenterol. 2007 Apr;102(4):803-13. University of York. Centre of Reviews and Dissemination (CRD). Health Technology Assessment (HTA) Database. [fecha de consulta: 1-4-08]. Disponible en: http://www.crd.york.ac.uk/CRDWeb/ShowRecord.asp?
View=Full&ID=12007001290