Kalveram L, Baumann U, De Bruyne R, Draijer L, Janczyk W, Kelly D, et al. Noninvasive scores are poorly predictive of histological fibrosis in paediatric fatty liver disease. J Pediatr Gastroenterol Nutr. 2024;78:27-35.
Conclusiones de los autores del estudio: las actuales escalas predictoras de fibrosis hepática carecen de precisión diagnóstica, por lo que se necesitan nuevas herramientas de diagnóstico no invasivas para estadificar la fibrosis.
Comentario de los revisores: las escalas no invasivas disponibles en la actualidad para detectar la presencia de fibrosis hepática en la enfermedad del hígado graso no alcohólico no tienen la suficiente precisión y exactitud diagnóstica, no mostrando ninguna ventaja sobre la biopsia hepática. Se necesitan mejores herramientas no invasivas para la clasificación y estadiaje de los pacientes afectos de hígado graso no alcohólico.
Cabrera Morente L, Ortega Páez E. Hígado graso: ¿es necesario revisar las escalas de diagnóstico no invasivo? Evid Pediatr. 2024;20:35.
Kalveram L, Baumann U, De Bruyne R, Draijer L, Janczyk W, Kelly D, et al. Noninvasive scores are poorly predictive of histological fibrosis in paediatric fatty liver disease. J Pediatr Gastroenterol Nutr. 2024;78:27-35.
Objetivo: aplicar las escalas no invasivas para la predicción de fibrosis hepática publicadas hasta el momento a una gran cohorte de pacientes pediátricos europeos con enfermedad del hígado graso no alcohólico (NAFLD, del inglés, nonalcoholic fatty liver disease), comprobada por biopsia para evaluar la precisión diagnóstica de estas para la fibrosis o diferenciar los grados de la misma, y determinar su aplicabilidad en la práctica clínica.
Diseño: es un estudio analítico de pruebas diagnósticas.
Emplazamiento: 10 centros hepáticos pediátricos europeos pertenecientes al grupo de hígado graso de la European Society For Paediatric Gastroenterology, Hepatology and Nutrition (ESPGHAN).
Población y estudio: se incluyeron 457 pacientes con NAFLD comprobada por biopsia de 10 centros europeos especializados en esta enfermedad desde 2008 a 2022. El análisis de datos se realizó entre junio de 2022 y enero de 2023.
Los criterios de inclusión fueron: edad entre 5-18 años con sobrepeso/obesidad (definido según los datos de referencia nacionales) y una indicación clínica para biopsia hepática.
Los criterios de exclusión fueron: más de 18 años, cualquier hepatopatía concurrente, enfermedad crónica subyacente grave.
Medición del resultado: se evaluó la precisión diagnóstica para la predicción de cualquier grado de fibrosis para la relación aspartato aminotrasferasa (AST)/plaquetas (APRI), FIB-4, NAFLD pediátrica, puntuación de fibrosis (PNFS) e índice de fibrosis de NAFLD pediátrico (PNFI).
Se compararon las puntuaciones de las escalas con un grupo control de 377 niños y adolescentes con obesidad sin biopsia hepática.
Las biopsias hepáticas fueron calificadas según la Red de Investigación Cínica sobre la NAFLD y los criterios de Kleiner/Brunt por el patólogo local. Se calculó la mediana y el rango intercuartílico (RIC) de las variables clínicas, de laboratorio e histológicas para la población total de estudio y los subgrupos, estratificados por género y estadio de fibrosis. Se realizaron pruebas no paramétricas y ji-cuadrado. Se determinaron las curvas de características del operador receptor (ROC) para la detección de fibrosis moderada y avanzada y se calculó el área bajo la curva ROC (AUROC). Para el rendimiento diagnóstico se calcularon el valor predictivo positivo (VPP), valor predictivo negativo (VPN), sensibilidad (S), especificidad (E) y la capacidad discriminatoria o diagnóstica de la escala para los puntos de corte publicados originalmente, considerando estadísticamente significativo p <0,05.
Resultados principales: la mediana de edad fue 13 años, la distribución niños y niñas 2:1. Al evaluar los valores analíticos en los pacientes estaba elevada la alanina aminotrasferasa (ALT), mientras que el resto de las enzimas hepáticas, lípidos y plaquetas fueron normales.
Los datos histopatológicos cubrieron todo el rango de fibrosis. Los pacientes con fibrosis moderada eran más jóvenes que los pacientes sin fibrosis o fibrosis leve. La estratificación de la cohorte por género mostró que los niños tenían más riesgo que las niñas de presentar fibrosis o fibrosis moderada, y que la edad más temprana era un factor de riesgo para un estadio de fibrosis más alto en niños pero no en niñas.
Se calcularon las puntuaciones de fibrosis no invasiva y se generaron curvas ROC y AUROC, se calculó también la de ALT para cualquier tipo de fibrosis. Para la detección de fibrosis moderada, el área bajo la curva fue: APRI 0,69 (intervalo de confianza al 95% [IC 95]: 0,64 a 0,74), FIB-4: 0,66 (IC 95: 0,60 a 0,72), PNFI: 0,51 (IC 95: 0,43 a 0,59), PNFS: 0,66 (IC 95: 0,59 a 0,72). Los AUROC para la detección de fibrosis avanzada fueron: APRI: 0,75 (IC 95: 0,69 a 0,82), FIB-4: 0,61 (IC 95: 0,52 a 0,70), PNFI: 0,52 (IC 95: 0,4 a 0,63), PNFS: 0,71 (IC 95: 0,62 a 0,7).
Las escalas de puntuación de fibrosis no mostraron ningún beneficio diagnóstico sobre el uso de ALT ≤50/>50 UI/l como punto de corte.
Todas las puntuaciones mostraron una baja sensibilidad para predecir la fibrosis hepática.
Conclusión: ninguna de las escalas demostró capacidad para detectar la presencia o no de fibrosis para reemplazar la biopsia hepática para la estadificación de fibrosis, pudiéndose obtener resultados similares con la ALT sola. Para la predicción de fibrosis moderada y avanzada las puntuaciones con mejor rendimiento, pero un valor predictivo positivo moderado fueron APRI y PNFS. Se necesitan nuevas herramientas de diagnóstico no invasivas para la estratificación del riesgo de fibrosis de la NAFLD pediátrica o revisar los puntos de corte de las escalas originales.
Conflicto de intereses: los autores indican que no tienen conflictos de interés.
Fuente de financiación: Fundación de Investigación Flandes, Ministerio de Salud Italiano, Ministerio Federal Alemán de Educación e Investigación.
Justificación: la NAFLD es la hepatopatía crónica más frecuente en la infancia, con una prevalencia del 9,6% entre los 2 y 19 años1. Está asociada a la obesidad, resistencia a la insulina y ciertas variantes genéticas. Recientemente, desde la comunidad científica se ha propuesto instaurar otra nomenclatura para desestigmatizar el concepto de hígado graso y el término confuso en pediatría de no alcohólico: enfermedad esteatósica hepática asociada a disfunción metabólica (MASLD). Se trata de un término más amplio que supone esteatosis hepática y al menos un factor de riesgo cardiometabólico2. El patrón de oro de diagnóstico del estadio fibrótico de la NAFLD es la biopsia hepática, pero la agresividad de la prueba hace necesario buscar otros métodos, como escalas de puntuación no invasivas para clasificar la presencia de fibrosis. El artículo que comentamos es pertinente porque evalúa estas escalas no invasivas.
Validez o rigor científico: se trata de un estudio de pruebas diagnósticas, retrospectivo. La población está bien definida: pacientes afectos de NAFLD, todos con el diagnóstico de referencia válido (fibrosis por biopsia) y aplicación y descripción completa de la prueba diagnóstica (escalas de fibrosis). Podrían existir varios sesgos: uno de selección, por representar mayor número de fibrosis mínimas que de medianas o graves, que podría disminuir potencia a la prueba diagnóstica. Otro sesgo, la mayor representación del género masculino que del femenino sin análisis estratificado en las curvas ROC por esta variable. Por último, un posible sesgo de validez de la prueba de referencia, al ser un estudio multicéntrico y variar las indicaciones y la interpretación de un centro a otro de la biopsia hepática, de dirección impredecible. El análisis de los datos es correcto.
Importancia clínica: de las escalas no invasivas de fibrosis estudiadas, la de mayor exactitud diagnóstica fue el APRI con una AUROC de 0,69 (IC 95: 0,64 a 0,74) para fibrosis moderada, y 0,75 (IC 95: 0,69 a 0,82) para fibrosis avanzada. Tomando como prevalencia de fibrosis moderada el 16%3, la aplicación de APRI supondría un aumento de la probabilidad diagnóstica del 11,7%; probabilidad posprueba (+) [PP (+)]: 27,5%; por cada 5 pacientes, solo a 1 se diagnosticaría correctamente (número necesario para diagnosticar [NND]: 5) y por cada 4 pacientes se diagnosticaría a 1 erróneamente (número necesario para diagnosticar mal [NNDM]: 4). De igual modo, tomando la prevalencia de fibrosis avanzada del 8%3, aumentaría la probabilidad diagnóstica el 11,2%; PP (+): 17,2%; por cada 3 pacientes 1 sería diagnosticado correctamente (NND: 3) y por cada 4, 1 erróneamente (NNDM: 4)*. Estos resultados son de exactitud moderada, magnitud escasa en la fibrosis moderada y mediana en la fibrosis avanzada, con un número muy parecido para diagnosticar correcta o erróneamente. Kim et al.5, en un estudio parecido al que comentamos realizado en población pediátrica, describen un rendimiento de la prueba mayor (AUROC: 0,87, S: 94%, E: 66%, VPP: 94%, VPN: 64%), debido probablemente a que no se les practicó la prueba de referencia a todos los pacientes y la variable resultado era poco discriminativa, incluyendo a todos los tipos de fibrosis hepática. Alkhouri et al.6, en un estudio de buena calidad metodológica, hallan cifras muy parecidas para fibrosis avanzada, AUROC: 0,74 (IC 95: 0,66 a 0,82). No hemos encontrado trabajos que valoren el coste/efectividad, pero en ambas pruebas los VPN son muy bajos, los falsos negativos son muy altos y los NND no son desdeñables.
Aplicabilidad en la práctica clínica: las escalas de fibrosis hepática tienen escasa precisión moderada para el diagnóstico de estadios de fibrosis en la NAFLD, con un alto número de FN y un alto coste en pruebas a realizar para clasificar correctamente a los pacientes. Aunque es de fácil implementación en la práctica diaria, no sería recomendable como única prueba para el estadiaje de la enfermedad. Se necesitan otras herramientas con mayor exactitud y rendimiento diagnóstico. Probablemente la implementación del aprendizaje automático, para desarrollar modelos predictivos revisando los puntos de corte de las escalas originales, podría ser una solución.
Conflicto de intereses de los autores del comentario: no existe.
Cabrera Morente L, Ortega Páez E. Hígado graso: ¿es necesario revisar las escalas de diagnóstico no invasivo? Evid Pediatr. 2024;20:35.