La mayoría de las evaluaciones implican la evaluación de intervenciones que ocurren en unidades más grandes que las de los individuos. Estos pueden ser áreas de captación del sistema de salud, escuelas, regiones geográficas o incluso países. En algunos casos, es apropiado y posible asignar aleatoriamente la intervención de interés al nivel de estas unidades más grandes y, como tal, aplicar el enfoque más eficiente y confiable para reducir la confusión.
Recursos Clave Para Aprender Acerca de los Ensayos aleatorios por conglomerados
Se ha desarrollado un nuevo sitio web de ensayos aleatorios por conglomerados para apoyar a quienes realizan ensayos aleatorios por conglomerados y diseños de cuñas escalonadas y a quienes llevan a cabo investigaciones metodológicas sobre estos diseños. El sitio web cuenta con las últimas publicaciones, software, debates y eventos relacionados con el diseño agrupado.
Este libro de Richard Hayes y Lawrence Moulton se ha convertido en el texto metodológico líder en esta área:
Cluster Randomised Trials
Hayes R, Moulton L. Cluster randomised trials. Chapman and Hall / CRC Press, Boca Raton, FL, 2009
Se proporciona un breve resumen de lo que ofrece el libro con respecto a estos temas:
Justificación y limitaciones de los ensayos aleatorizados por grupos
Hay varias circunstancias en las que los ensayos aleatorizados por grupos son apropiados y pueden elegirse sobre otros diseños aleatorizados. Algunas intervenciones, por su naturaleza, están destinadas a aplicarse a comunidades enteras en lugar de a personas individuales, como los programas educativos o la mejora del suministro de agua en las aldeas. En algunas circunstancias, la aleatorización de grupos ofrece más comodidad logística o se recibiría con mayor aceptación cuando se entregara a toda la población en lugar de a nivel individual. Los ensayos aleatorizados en grupos también son una forma eficaz de evitar la contaminación y esta es una de las razones más comunes para adoptar este diseño. Finalmente, los CRT permiten capturar los efectos directos e indirectos de una intervención, proporcionando una medida del efecto general de implementar una intervención en una población. Esto es particularmente útil cuando se consideran enfermedades infecciosas. Los que reciben la intervención se benefician tanto del efecto directo de la intervención sobre la susceptibilidad a la infección como de los efectos indirectos de la masa que dan lugar a una reducción de la exposición a la infección.
Al considerar un diseño aleatorizado de clúster, estas ventajas deben sopesarse frente a las limitaciones.Es importante tener en cuenta la eficiencia estadística y de costos. La potencia y precisión de un ensayo aleatorizado en clúster es inferior a la de un ensayo aleatorizado individual, y los aspectos logísticos de trabajar en varios grupos diferentes pueden hacer que la implementación de un TRC sea costosa. Otras cuestiones a considerar son el sesgo de selección, el desequilibrio entre los grupos de estudio y la generalización. La justificación, junto con las limitaciones y estrategias para minimizarlas, se analizan en el capítulo 3.
Consideraciones de diseño
Opciones de diseño para los Brazos de tratamiento
Diseño de grupos paralelos
Este es el diseño más común tanto para ensayos aleatorizados individuales como en grupo. Bajo este diseño, cada racimo permanece en el brazo al que fue asignado aleatoriamente durante todo el ensayo.
Tres grupos de ensayos
Dado el gasto y la complejidad logística asociados con los TRC, y la dificultad de inscribir suficientes grupos para proporcionar un tamaño de muestra adecuado en cada grupo de tratamiento, la gran mayoría de los TRC siguen un diseño de estudio en el que los grupos se aleatorizan a solo dos grupos de tratamiento. Los ensayos de tres grupos a veces son factibles, sin embargo, los TRC con más de tres grupos son muy poco frecuentes. Sin embargo, cuando se consideran, siguen dos enfoques principales: La primera compara dos intervenciones diferentes con un grupo de control, y la segunda compara la misma intervención administrada a diferentes niveles de intensidad con un grupo de control para producir un análisis de respuesta a la dosis.
Ensayos factoriales
Convencionalmente, para estimar el efecto de dos intervenciones se requeriría diseñar dos ensayos o realizar un ensayo de tres grupos, lo que tiene la desventaja de un tamaño de muestra más pequeño en cada grupo. Los diseños factoriales permiten estudiar los efectos independientes de dos intervenciones en el mismo ensayo. Esto tiene la ventaja de ser rentable y de conservar el tamaño de la muestra. El diseño toma un diseño de 2 X 2 que resulta en cuatro brazos de tratamiento: un brazo que recibe la primera intervención, otro que recibe la segunda intervención, un brazo que recibe ambas intervenciones y, finalmente, un brazo de control. El modelo da como resultado cuatro grupos de tratamiento, sin embargo, la estimación del efecto de cada intervención se realiza comparando una combinación relevante de dos de los grupos con la combinación de los dos grupos restantes. Este enfoque solo es válido si no hay interacción entre las intervenciones. Cuando se esperan interacciones, o se desean, se pueden usar diseños factoriales para identificar el efecto conjunto de dos intervenciones, sin embargo, se pueden requerir tamaños de muestra más grandes.
Diseño cruzado
El objetivo de este diseño es controlar la tendencia del tiempo. Este diseño se utiliza comúnmente en ensayos aleatorizados individuales y se ha adoptado para los TRC. Cada grupo recibe dos tratamientos, uno tras otro. A menudo hay un período intermedio llamado período de lavado para evitar cualquier efecto de arrastre.
Diseño de cuña escalonada
Haga clic aquí para obtener más información sobre este diseño.
Tipo y tamaño de los grupos
Una de las primeras decisiones que se deben tomar al diseñar un TRC se refiere a la elección y definición de los grupos que se van a aleatorizar durante el ensayo. Hay una amplia variedad de tipos y tamaños de grupos que van desde familias u hogares con pocos individuos, hasta grandes áreas geográficas que contienen millones de individuos. Los elementos prácticos de la ejecución de esos juicios son muy diferentes. El capítulo 4 considera los diferentes tipos de estudio de clúster y se analizan las principales cuestiones a considerar en la elección del tamaño del clúster.
Contaminación
La contaminación ocurre cuando las respuestas en un grupo están distorsionadas debido al contacto con individuos de fuera del grupo, y esto aún puede ocurrir y plantear un problema importante en los TRC. Esto podría ocurrir debido al contacto entre los grupos de intervención y los grupos de control. También podría ocurrir debido al contacto entre los grupos de intervención o los grupos de control y la población en general. Las estrategias para reducir el grado de contaminación en un TRC incluyen la selección de grupos suficientemente distantes y bien separados de cada uno. En circunstancias en que las zonas geográficas se asignan a las armas de intervención o de control en lugar de a comunidades específicas, las zonas de amortiguación se utilizan para que los grupos no tengan límites comunes entre ellos. Estas dos estrategias se utilizan para garantizar que no se produzca contaminación entre los grupos de intervención y de control. El «diseño de huevo frito» es una estrategia utilizada para reducir el contacto entre los grupos de intervención o control y la población en general. En el capítulo 4 se examinan con más detalle las formas en que se produce la contaminación y las estrategias para reducirla.
Enfoques para medir los resultados de individuos
Los resultados de interés se miden a partir de una muestra de individuos seleccionados de cada grupo. Hay dos enfoques principales para medir a los individuos, dependiendo del resultado: encuestas transversales o cohortes. En el capítulo 8 se ofrece un análisis completo de cuándo se pueden utilizar cada una de ellas y de sus ventajas y desventajas.
Muestras transversales repetidas
Los estudios transversales requieren tomar una muestra repetida de cada grupo en momentos diferentes. Se utiliza cuando la medida del resultado es un resultado binario (como la prevalencia del VIH o el tabaquismo) o un criterio de valoración cuantitativo (como el nivel medio de colesterol o la estatura media de los niños).
Seguimiento de cohorte
El enfoque de cohorte implica el seguimiento de individuos seleccionados a lo largo del tiempo. Esto se usa cuando la medida del resultado es una tasa o riesgo de eventos que ocurren durante un período de seguimiento específico. La cohorte puede consistir en la población total de un grupo o una muestra aleatoria de ese grupo. Cuando se va a hacer un seguimiento de la población total, se debe especificar si se considerarán nuevas personas que ingresen a la población en una fecha posterior o si se limitará el estudio a solo las que se observan al inicio del estudio.
Tamaño de la muestra
Al diseñar un CRT, el tamaño de la muestra es uno de los factores más importantes a considerar. El tamaño de muestra inadecuado aumenta el error aleatorio, reduce el poder del estudio y, por lo tanto, reduce la capacidad de cuantificar el efecto con precisión. El capítulo 7 establece en detalle los métodos necesarios para seleccionar un tamaño de muestra apropiado para un CRT. Esto incluye métodos para diseños de estudios no coincidentes, emparejados y estratificados, así como métodos para seleccionar un tamaño de muestra apropiado para cada grupo.
Características Que Requieren Métodos Especiales de Diseño y Análisis
Correlación entre grupos y Variabilidad Entre grupos
En ensayos aleatorizados individuales, se supone que los individuos proporcionan observaciones estadísticamente independientes en el resultado de interés. Sin embargo, esta suposición no es cierta en los TRC, ya que las observaciones en individuos dentro del mismo grupo tienden a estar correlacionadas. Esto significa que el conocimiento del resultado de un individuo tenderá a proporcionar información sobre el resultado de otro individuo en el mismo grupo. La correlación entre conglomerados ocurre en TRC por tres razones principales:
Agrupación de características de la población
Existen variaciones entre diferentes poblaciones debido a diferencias en los individuos que componen cada conglomerado, como características demográficas o socioeconómicas, o debido a diferencias en variables a nivel de conglomerado, como características ambientales del conglomerado.
Variaciones en la respuesta a la Intervención
Diferentes grupos pueden responder de manera diferente a las intervenciones, lo que da lugar a variaciones en los resultados entre grupos, incluso si la variación en los resultados entre grupos estaba ausente antes de la intervención.
La correlación debida a la interacción entre individuos
La aleatorización de grupos puede ser particularmente importante en ensayos de intervenciones en los que un individuo de ese grupo puede tener un efecto directo o indirecto en el resultado de otros individuos, como intervenciones contra enfermedades infecciosas o programas de educación sanitaria en los que los mensajes educativos son discutidos por miembros de la comunidad que conducen a similitudes en el comportamiento.
El alcance de la correlación entre grupos depende de la existencia de otros grupos y de la naturaleza y el tamaño de los grupos. La correlación entre conglomerados depende de la existencia de otros conglomerados: no tiene sentido si solo hay una población de estudio, en un conglomerado, bajo consideración. Además, solo existe si existe una verdadera variabilidad en los resultados entre los grupos. Por lo tanto, la correlación entre grupos y la variabilidad entre grupos pueden considerarse conceptos correspondientes que proporcionan dos perspectivas diferentes sobre los mismos fenómenos subyacentes. Las inferencias que se pueden hacer a partir de una TRC dependen del grado de variabilidad entre conglomerados en el resultado de interés, por lo tanto, deben medirse adecuadamente y considerarse en el diseño y análisis de una TRC. Hay dos enfoques mediante los cuales se puede resumir la variabilidad entre grupos: el coeficiente de variación entre grupos y el coeficiente de correlación intra-grupo. Estos se discuten a fondo en el Capítulo 2 del libro.
Desequilibrios de los grupos del estudio
Debido a limitaciones prácticas y financieras, el número de grupos aleatorizados en una TRC a menudo es bastante pequeño en comparación con el número de individuos reclutados típicamente para un ensayo aleatorizado individual. Con un pequeño número de racimos, la aleatorización no garantiza que los dos grupos estén equilibrados, por lo que un desequilibrio entre los grupos de estudio en uno o más factores de confusión potenciales es un riesgo cuando simplemente se aleatoriza un pequeño número de racimos. Se pueden utilizar estrategias de diseño, como el emparejamiento y la estratificación, para mejorar el equilibrio entre los grupos de tratamiento y reducir la variabilidad entre grupos. Estas cuestiones se examinan en el capítulo 5 y también se proporcionan directrices sobre cuándo deben utilizarse estas estrategias.
El emparejamiento puede ayudar a minimizar las diferencias entre los grupos de tratamiento con respecto a las características basales, y puede mejorar la potencia y precisión del estudio. Si hay una variabilidad sustancial entre los grupos, se puede decidir agrupar primero los grupos que se espera que sean similares con respecto al resultado de interés, y asignar el tratamiento dentro de estos grupos. Agrupar los racimos en pares similares asegura que los brazos de tratamiento sean similares al inicio, al menos con respecto a las características que elegimos para coincidir.
La estratificación implica agrupar los grupos disponibles en dos o más estratos que se espera que sean similares con respecto al resultado de interés. Los grupos dentro de cada estrato se distribuyen aleatoriamente entre los grupos de tratamiento. La estratificación tiene varias ventajas sobre el diseño combinado.
Los diseños emparejados y estratificados son ejemplos de aleatorización restringida, ya que estos esquemas implican la selección aleatoria de un conjunto más pequeño de asignaciones que cumplen ciertas restricciones.
Si bien estos diseños pueden ayudar a reducir los desequilibrios entre los grupos de tratamiento, hay circunstancias en las que no se puede confiar en ellos para lograr un equilibrio adecuado, en particular cuando hay varias variables en las que se requiere equilibrio. En tales circunstancias, se puede emplear otro enfoque de aleatorización restringida que logre el equilibrio general entre los grupos de tratamiento. El equilibrio general se refiere a cuando cada una de las variables se distribuye de manera similar entre los grupos de tratamiento y no requiere que haya equilibrio dentro de los subgrupos. Esto se hace utilizando datos de referencia o preexistentes en cada clúster, y restringiéndose a asignaciones que satisfagan ciertos criterios de equilibrio predeterminados. El capítulo 6 explica este enfoque de la aleatorización restringida y describe los tipos de variables sobre las que se requeriría un equilibrio, cómo definir los criterios de equilibrio que restringirían las asignaciones y las circunstancias en las que debería considerarse la reenumeración de asignaciones. Cuando se utiliza un esquema de aleatorización restringida, existe el riesgo de producir un diseño sesgado o no válido, lo que da lugar a métodos estándar de inferencia estadística que dan resultados incorrectos. Este capítulo también explica qué se entiende por sesgo y validez, cuándo pueden ocurrir y cómo explicarlos.
Análisis
Hay dos enfoques principales: el análisis basado en medidas de resumen a nivel de grupo y el análisis basado en datos a nivel individual utilizando métodos de regresión que permiten correlaciones entre grupos.
El principio primario de ambos métodos es que tienen en cuenta las dos características clave de los TRC discutidas anteriormente: correlaciones entre grupos y desequilibrios casuales entre los grupos de estudio resultantes de un pequeño número de grupos.
El libro no detalla todos los métodos posibles que se pueden usar para el análisis de CRTs, sino que se centra en los que se ha demostrado que son eficientes y robustos en los Capítulos 9-12.
El método de análisis debe ser adecuado para el diseño específico.
Notificación e interpretación
Existe un creciente cuerpo de pruebas y experiencia de ensayos aleatorizados por grupos para evaluar el impacto de las intervenciones en los resultados de salud, y las directrices ampliadas de CONSORT están disponibles para guiar la notificación de dichos ensayos:
Declaración de Consort 2010: extensión a los ensayos aleatorizados por grupos.
Campbell MK, Piaggio G, Elbourne DR, Altman DG. Declaración Consort 2010: extensión a los ensayos aleatorizados por conglomerados.
El capítulo 15 del libro de Ensayos Aleatorizados por grupos de Hayes y Moulton analiza y explica las directrices de CONSORT.