En el diseño clásico del ensayo clínico aleatorizado está previsto que cada participante se asigne de manera aleatoria al grupo de la intervención en estudio o al grupo control. Una vez formados los grupos, se lleva a cabo la intervención y se realiza el seguimiento para, finalmente, comparar los resultados obtenidos en los dos grupos del ensayo1.
Es esta asignación aleatoria la que nos garantiza la comparabilidad de los dos grupos, que deberían ser similares en todos los aspectos, excepto en la intervención ensayada. De esta forma, cualquier diferencia que podamos obtener en los resultados entre los dos grupos debería estar relacionada con la intervención, que es la única diferencia entre los dos.
Un problema frecuente a la hora de realizar los ensayos clínicos son las pérdidas de participantes durante la realización de los mismos, ya sea por abandonos voluntarios, por falta de cumplimiento, por confusiones a la hora de realizar el tratamiento asignado o, incluso, por exclusiones, llevadas a cabo por el experimentador, una vez que se ha puesto en marcha el ensayo.
La falta de cumplimiento puede producirse por la aparición de efectos secundarios, por cambios en la situación de los participantes a lo largo del estudio o, simplemente, por una pérdida de interés por parte del participante2.
En otras ocasiones, la causa de la exclusión puede ser responsabilidad del investigador. Hay ocasiones en las que, después de la aleatorización, el investigador puede decidir que determinados participantes no son idóneos para recibir la intervención, bien por cambios en su enfermedad o situación o por la aparición de información nueva, como puede ser algún resultado analítico.
El problema que ocasionan estas circunstancias es la pérdida de información para el análisis o, surgiéndonos dudas sobre si excluir a los sujetos afectos, y en el caso de incluirlos, en qué grupo hacerlo, cuando la pérdida haya afectado al cumplimiento terapéutico.
Es importante tener en cuenta que las pérdidas de participantes no tienen la misma trascendencia si se producen antes o después de la aleatorización. Las pérdidas prealeatorización afectan fundamentalmente a la generalización de las conclusiones del estudio, por lo que comprometen su validez externa.
Por otra parte, las pérdidas postaleatorización pueden comprometer la validez interna del estudio y hacer que sus conclusiones sean poco fiables. Por un lado, al disminuir el número de sujetos disminuye el tamaño muestral efectivo, por lo que el estudio pierde potencia estadística y puede no ser capaz de detectar significación estadística para el tamaño de efecto que previamente se había calculado. Además, si las pérdidas no se producen al azar (cuando son más frecuentes en un grupo), los grupos pierden la comparabilidad y pueden sesgarse los resultados del ensayo.
Los resultados de todas las variables del estudio, y especialmente los de la variable principal de resultado, deberían estar recogidos de forma completa. Sin embargo, es habitual que haya datos ausentes (missing) entre las variables del estudio. El problema es que la mayor parte de los procedimientos estadísticos se llevan a cabo con registros completos, ignorando aquellos participantes en los que falta algún dato. Una vez más, esto disminuye el tamaño muestral efectivo y, con ello, la potencia del estudio.
En el caso de que los datos faltantes puedan afectar la validez del estudio, podemos recurrir a dos estrategias. La primera, realizar una imputación de datos mediante cualquiera de las técnicas disponibles3. De esta forma se rellenan los huecos para poder aprovechar toda la muestra a la hora de analizar los resultados (se asignan los valores más probables según el perfil del resto de la muestra). La segunda posibilidad es hacer un análisis de casos extremos, que consiste en asignar a los datos ausentes los peores y los mejores resultados posibles y ver cómo afectan a las conclusiones del estudio (análisis de sensibilidad “en el peor o mejor de los casos”). Cuando un análisis “en el peor de los casos” sigue siendo favorable al tratamiento en estudio, podemos estimar que las pérdidas no influirán en el resultado.
En algunos ensayos, por su diseño, puede haber sujetos que reciban una intervención diferente a la aleatoriamente asignada. Cuando el grupo control no recibe tratamiento alguno o bien recibe placebo, el paciente del grupo intervención que no cumple el tratamiento podría comportarse como los sujetos del grupo control. En otras ocasiones se produce directamente un intercambio de intervenciones. Pensemos en un ensayo cuya intervención es un programa de educación sobre diabetes que se proporciona de forma aleatoria a los pacientes de un determinado hospital. Los incluidos en el grupo de control pueden tener conocimiento de la intervención y acudir a las sesiones de formación, produciéndose una contaminación entre las dos ramas del ensayo. En cualquiera de estos casos el investigador se planteará el dilema de qué hacer con estos participantes, si prescindir de ellos o incluirlos en los grupos de estudio alternativos. Para resolver esta situación existen diferentes estrategias de análisis de resultados (Figura 1).
Figura 1. Estrategias de análisis en el ensayo clínico aleatorizado. Ejemplo de sujeto que no cumple el tratamiento en estudio (asignado a grupo control en análisis por protocolo y al grupo tratamiento, originalmente asignado, en el análisis por intención de tratar). Mostrar/ocultar
Quizás la opción más inmediata es analizar cada sujeto según el tratamiento que ha realizado y no según el grupo al que fue aleatorizado. Esto es lo que se denomina análisis por protocolo2. El problema con esta estrategia, como ya hemos comentado, es que se pierde el balance proporcionado por la aleatorización. Además, si los pacientes que cambian de grupo o se pierden durante el estudio tienen características especiales pueden sesgarse los resultados del ensayo. Pensemos, por ejemplo, en las retiradas por efectos secundarios o, incluso, por curación, serán generalmente más frecuentes en el grupo de tratamiento que en el grupo control.
El análisis por protocolo tiene una ventaja, que es su mayor validez externa, ya que analizar los datos tal y como se han producido en la realidad proporcionará una mejor idea de cómo puede funcionar el tratamiento en las condiciones habituales de trabajo.
Otra estrategia consiste en respetar la asignación de grupos que se hizo de forma aleatoria. Este es el denominado análisis por intención de tratar4. La ventaja principal de esta forma de análisis es que mantiene el balance de posibles variables de confusión que nos proporcionó la aleatorización, asegurando así la comparabilidad de los dos grupos. Su inconveniente es que proporciona una análisis mucho más conservador, ya que favorece la hipótesis nula de no diferencia de efecto entre los dos grupos. Claro que este inconveniente deja de ser tal cuando, a pesar de atenuar las diferencias, realizando un análisis por intención de tratar, se obtiene una diferencia de efecto que es estadísticamente significativa.
Algunos autores describen una tercera posibilidad, el análisis por intención de tratar modificado5. En este caso, se incluye cada participante en el grupo de asignación aleatoria correspondiente, pero se permite la exclusión de algunos, como pueden ser aquellos que nunca comenzaron el tratamiento o los que no se consideran adecuados para el estudio. El problema es que esto facilita la posibilidad de manipular los datos según los intereses del investigador y sesgar los resultados en su provecho. Por este motivo, estas condiciones de exclusión deben estar especificadas previamente en el protocolo del ensayo y no decidirse posteriormente ad hoc.
¿Cuál de estas estrategias es más conveniente adoptar? Existe acuerdo en que, si se utiliza una de ellas de forma aislada, lo más correcto es emplear un análisis por intención de tratar. Sin embargo, quizás lo más seguro y conveniente sea realizar ambos análisis y comparar los resultados que se obtiene con cada uno. Si así lo hacemos podría ocurrir que detectásemos un efecto significativo con el análisis por protocolo y no con el análisis por intención de tratar. Esto puede deberse a dos causas principales. La primera, que el análisis por protocolo puede crear asociaciones espurias al romper el balance de variables de confusión que nos garantizaba la aleatorización. La segunda, ya lo hemos comentado, el análisis por intención de tratar es más conservador que el análisis por protocolo. En cualquier caso, lo verdaderamente interesante será tratar de explicar las diferencias encontradas con los dos métodos para poder hacer una correcta valoración de las conclusiones del ensayo.
Molina Arias M, Ochoa Sangrador C. Ensayo clínico (V). Estrategias de análisis. Pérdidas de información. Análisis por intención de tratar. Evid Pediatr. 2015;11:52.