Medicina Basada en la Evidencia
Lectura crítica de artículos de revisión sistemática y metanálisis… – 467 – ficiente como para intentar combinarlos, se tratará de medir la heterogeneidad con algún método estadístico. La forma más usada para estudiar la heterogeneidad es el gráfico en embudo o funnel plot . A partir de esta visualización gráfica de los estudios, cabe su corrobo- ración estadística. Entre los métodos estadísticos em- pleados para el estudio de heterogeneidad, quizás el más clásico sea la Q de Cochran, aunque el más utiliza- do en la actualidad es la I 2 (y existe un tercer método menos conocido, H 2 ). Con I 2 se suelen usar los límites de 25%, 50% y 75% para establecer si hay heterogeneidad baja, moderada y alta, respectivamente. En resumen, siempre que se muestre un indicador de homogeneidad que represente un porcentaje indicará la proporción de variabilidad que no es debida al azar y se considerará una heterogeneidad significativa cuando p <0,05. Ade- más, se han ideado una serie de gráficos para inspec- cionar los estudios y comprobar que no hay datos de heterogeneidad, siendo los más utilizados el gráfico de Galbraith y el gráfico de l´Abbé. Si se considera que existe una heterogeneidad signifi- cativa entre los estudios primarios habrá varias posibi- lidades: 1) no combinar los estudios primarios y limitar- se a una síntesis cualitativa de los resultados; 2) hacer un análisis estratificado según la variable que cause la heterogeneidad, siempre que sea posible identificarla; 3) recurrir a una metarregresión, opción más compleja. 2. Analizar la IMPORTANCIA de las publicaciones sobre revisiones sistemáticas y/o metanálisis Las preguntas del apartado anterior se utilizan para analizar la validez interna de una investigación y de- cidir si un artículo merece una lectura más detallada. El siguiente paso es proceder a una evaluación de los resultados, en relación con la importancia clínica po- tencial de los hallazgos de la RS y/o MA. ¿Cuál es el resultado global de la revisión? ¿Han sido interpretados con sentido común? Una RS y/o MA busca proporcionar una estimación glo- bal del efecto de una intervención basada en un prome- dio ponderado de los resultados de todos los estudios de calidad disponibles. Generalmente, los resultados de cada estudio se ponderan por el inverso de su varian- za, de forma que se concede un mayor peso a los estu- dios de mayor tamaño que proporcionan estimaciones más precisas. A veces, la ponderación también tiene en cuenta la calidad metodológica de los estudios. Los resultados suelen expresarse como una medida rela- tiva ( odds ratio [OR], riesgo relativo [RR], reducción rela- tiva del riesgo [RRR]), aunque sería conveniente comple- mentarla con una medida absoluta: reducción absoluta del riesgo [RAR], número necesario de pacientes a tratar [NNT]). Un buen MA debe ser más fácil de interpretar que el conjunto de ensayos clínicos (u otros estudios) que contiene. Aparte de sintetizar los datos numéricos, la in- formación relevante relativa a los estudios primarios in- cluidos debe estar correctamente tabulada (criterios de inclusión, tamaños de muestra, características de los pa- cientes, características fundamentales de los estudios, resultados principales y secundarios). Actualmente, los resultados de los MA tienden a pre- sentarse de manera estandarizada. El resultado prin- cipal de cada uno de los estudios incluidos en la revi- sión se indica como una línea horizontal, cuya anchura representa el intervalo de confianza (IC) del 95% de la estimación de la medida del efecto (lo que indica la precisión del resultado), y en la que una señal indica la estimación puntual observada. La línea vertical en el centro del gráfico representa la “línea de efecto nulo”, con una OR igual a 1 o una diferencia de medias igual a 0. En caso de que la línea horizontal (intervalo de con- fianza) se cruce con la línea vertical, esto puede sig- nificar que, o bien no existen diferencias significativas entre los tratamientos, o que el tamaño de la muestra es insuficiente para detectar dichas diferencias. Cada uno de los estudios individuales tiene su OR y su IC, pero el diamante de la parte inferior de las líneas ho- rizontales representa la suma de los OR de todos los EC, con un nuevo IC mucho más estrecho o preciso. Si el diamante sobrepasara claramente la línea de efecto nulo, no podríamos afirmar con seguridad que un tra- tamiento es mejor que otro. Cuanto más estrecho sea el diamante, más preciso será el resultado final, y cuanto más alejado esté de la línea de efecto nulo, más clara será la diferencia entre los tratamientos comparados. La Colaboración Cochrane recomienda estructurar el diagrama de efectos ( forest plot o diagrama de bosque) en cinco columnas bien diferenciadas ( Figura 2 ): 1) se listan los estudios primarios (autor y año) con los gru- pos o subgrupos de pacientes incluidos en el MA; 2) re- sultados de cada estudio (tanto del grupo intervención como del grupo control); 3) la representación propia del forest plot , tal como se ha explicado previamente y alrededor de la línea vertical del efecto nulo y con el diamante como resultado combinado; 4) estimación del peso de cada estudio (en proporción); y 5) estimación del efecto ponderado de cada estudio. En este gráfico también se indica la medida de heterogeneidad. La principal asunción de un MA para obtener una estima- ción conjunta es que las diferencias entre los estudios son debidas exclusivamente al azar, es decir, que son estudios homogéneos. Por lo tanto, en primer lugar, debe analizar- se la homogeneidad tanto clínica como estadística de los estudios, tanto con métodos gráficos como con las prue- bas estadísticas adecuadas referidas previamente. Si se decide que pueden combinarse los estudios primarios, esto no puede hacerse uniendo sin más todos los resul- tados (riesgo de que se produzca la paradoja de Simp- son), sino que se pueden utilizar dos modelos: modelo de
RkJQdWJsaXNoZXIy MTAwMjkz