Klyngelandomiserede forsøg / kvantificering af påvirkning /LSHTM

de fleste evalueringer involverer vurdering af interventioner, der forekommer ved enheder, der er større end individer. Disse kan være sundhedssystemafvandingsområder, skoler, geografiske regioner eller endda lande. I nogle tilfælde er det hensigtsmæssigt og muligt tilfældigt at allokere interventionen af interesse på niveauet for disse større enheder og som sådan anvende den mest effektive og pålidelige tilgang til at reducere forvirring.

nøgleressourcer til at lære om Klyngelandomiserede forsøg
begrundelse og begrænsninger for Klyngelandomiserede forsøg
Designovervejelser
funktioner, der kræver særlige metoder til Design og analyse
analyse
rapportering og fortolkning

nøgleressourcer til at lære om Klyngelandomiserede forsøg

en ny hjemmeside for klyngelandomiserede forsøg er udviklet til at støtte dem, der udfører klyngelandomiserede forsøg og trinvise kiledesign, og dem, der udfører metodologisk forskning i disse designs. Hjemmesiden har de seneste publikationer, programmer, diskussioner og begivenheder relateret til grupperet design.

denne bog af Richard Hayes og Laurence Moulton er blevet den førende metodologiske tekst på dette område:

Cluster randomiserede forsøg
Hayes R, Moulton L. Cluster randomiserede forsøg. Chapman og Hall/CRC Press , Boca Raton , FL, 2009

en kort oversigt over, hvad bogen tilbyder, gives med hensyn til disse emner:

begrundelse og begrænsninger for Klyngelandomiserede forsøg

der er flere omstændigheder, hvor klyngelandomiserede forsøg er passende og kan vælges frem for andre randomiserede designs. Nogle interventioner er efter deres natur beregnet til at blive anvendt på hele samfund snarere end individuelle mennesker, såsom uddannelsesprogrammer eller forbedring af vandforsyningen i landsbyer. Under nogle omstændigheder tilbyder klyngelandomisering mere logistisk bekvemmelighed eller ville blive modtaget med større accept, når den leveres til hele befolkningen snarere end på individuelt niveau. Cluster randomiserede forsøg er også en effektiv måde at undgå forurening, og dette er en af de mest almindelige årsager til at vedtage dette design. Endelig tillader CRT ‘ er både de direkte og indirekte virkninger af en intervention at blive fanget, hvilket giver et mål for den samlede effekt af at gennemføre en intervention i hele en befolkning. Dette er især nyttigt, når man overvejer smitsomme sygdomme. De, der modtager interventionen, drager fordel af både den direkte virkning af interventionen på modtageligheden for infektionen og de indirekte masseeffekter, der resulterer i en reduktion i eksponeringen for infektionen.

når man overvejer et klynge randomiseret design, skal disse fordele afvejes mod begrænsningerne.Statistik og omkostningseffektivitet er vigtige at overveje. Effekten og præcisionen af et klyngeramikeret forsøg er lavere end et individuelt randomiseret forsøg, og de logistiske aspekter ved at arbejde i flere forskellige klynger kan gøre en CRT dyr at implementere. Andre spørgsmål at overveje er selektionsforstyrrelse, ubalance mellem undersøgelsesarme og generaliserbarhed. Begrundelsen sammen med begrænsningerne og strategierne for at minimere dem diskuteres i kapitel 3.

Designovervejelser

designvalg til behandlingsarme

Parallel Gruppedesign

dette er det mest almindelige design til både individuelt og klyngelandomiserede forsøg. Under dette design forbliver hver klynge i armen, som den tilfældigt blev tildelt gennem hele forsøget.

tre armforsøg

i betragtning af den udgift og logistiske kompleksitet, der er forbundet med CRT ‘er, og vanskeligheden ved at indskrive nok klynger til at give en passende stikprøvestørrelse i hver behandlingsarm, følger det store flertal af CRT’ er et undersøgelsesdesign, hvor klynger randomiseres til kun to behandlingsarme. Tre-arm forsøg er undertiden muligt, men CRT ‘ er med mere end tre arme er meget ualmindelige. Imidlertid, når de overvejes, de følger to hovedmetoder: Den første sammenligner to forskellige interventioner med en kontrolarm, og den anden sammenligner den samme intervention givet ved forskellige intensitetsniveauer med en kontrolarm for at producere en dosisresponsanalyse.

Faktorforsøg

konventionelt, for at estimere effekten af to interventioner ville det kræve enten at designe to forsøg eller gennemføre et tre-arm forsøg, som har ulempen ved en mindre prøvestørrelse i hver arm. Factorial design tillader undersøgelse af de uafhængige virkninger af to interventioner i samme forsøg. Dette har fordelen ved at være omkostningseffektiv og bevare stikprøvestørrelsen. Designet tager et 2 gange 2 layout, hvilket resulterer i fire behandlingsarme: den ene arm modtager den første intervention, en anden modtager den anden intervention, en arm modtager begge indgreb og til sidst en kontrolarm. Modellen resulterer i fire behandlingsarme, men estimering af effekten af hver intervention udføres ved at sammenligne en relevant kombination af to af armene mod kombinationen af de resterende to arme. Denne tilgang er kun gyldig, hvis der ikke er nogen interaktion mellem interventionerne. Hvor interaktioner forventes eller ønskes, kan factorial design bruges til at identificere den fælles effekt af to interventioner, men større prøvestørrelser kan være påkrævet.

Cross over Design

formålet med dette design er at styre for tid trend. Dette design bruges ofte i individuelt randomiserede forsøg og er blevet vedtaget for CRT ‘ er. Hver klynge modtager to behandlinger, den ene efter den anden. Der er ofte en periode imellem kaldet udvaskningsperioden for at undgå eventuelle overførselseffekter.

Stepped kile Design

Klik her for at lære mere om dette design.

type og størrelse af klynger

en af de første beslutninger, der skal træffes ved design af en CRT, vedrører valget og definitionen af de klynger, der skal randomiseres under forsøget. Der er en bred vifte af typer og størrelser af klynger, der spænder fra familier eller husstande med et par individer, til store geografiske områder, der indeholder millioner af individer. De praktiske elementer i gennemførelsen af sådanne forsøg er meget forskellige. Kapitel 4 behandler de forskellige typer studieklynger og diskuterer de centrale spørgsmål, der skal overvejes ved valg af klyngestørrelse.

kontaminering

kontaminering opstår, når reaktioner i en klynge forvrænges på grund af kontakt med personer uden for klyngen, og dette kan stadig forekomme og udgøre et vigtigt problem i CRT ‘ er. Dette kan ske på grund af kontakt mellem interventionsklyngerne og kontrolklyngerne. Det kan også ske på grund af kontakt mellem interventionsklyngerne eller kontrolklyngerne og den bredere befolkning. Strategier til at reducere graden af forurening i en CRT inkluderer valg af klynger, der er tilstrækkeligt fjerne og godt adskilt fra hver. Under omstændigheder, hvor geografiske områder tildeles enten interventions-eller kontrolarmene snarere end specifikke samfund, anvendes bufferområder til, at klynger ikke har fælles grænse mellem dem. Disse to strategier bruges til at sikre, at der ikke forekommer forurening mellem interventions-og kontrolklyngerne. Det ‘stegte ægdesign’ er en strategi, der bruges til at reducere kontakten mellem interventions-eller kontrolklyngerne og den bredere befolkning. De måder, hvorpå forurening opstår, og strategierne for at reducere dem diskuteres yderligere i kapitel 4.

tilgange til måling af resultater fra enkeltpersoner

resultaterne af interesse måles fra en prøve af individer valgt fra hver klynge. Der er to hovedmetoder til måling af individer, afhængigt af resultatet: tværsnitsundersøgelser eller kohorter. En fuldstændig diskussion om, hvornår hver enkelt kan bruges, og deres fordele og ulemper findes i kapitel 8.

gentagne tværsnitsprøver

tværsnitsundersøgelser kræver, at der tages en gentagen prøve fra hver klynge på forskellige tidspunkter. Det bruges, når målingen af resultatet er et binært resultat (såsom HIV-eller rygeprævalens) eller et kvantitativt endepunkt (såsom det gennemsnitlige kolesterolniveau eller den gennemsnitlige højde for børn).

kohort opfølgning

kohortmetoden involverer opfølgning af udvalgte individer over tid. Dette bruges, når målingen af resultatet er en hastighed eller risiko for begivenheder, der opstår i en specificeret opfølgningsperiode. Kohorten kan bestå af den samlede population af en klynge eller en tilfældig prøve fra den klynge. Når den samlede befolkning skal følges op, skal det specificeres, om nye mennesker, der kommer ind i befolkningen på et senere tidspunkt, vil blive overvejet eller at begrænse undersøgelsen til kun dem, der ses ved baseline.

prøvestørrelse

når du designer en CRT, er prøvestørrelse en af de vigtigste faktorer at overveje. Utilstrækkelig prøvestørrelse øger den tilfældige fejl, reducerer undersøgelsens styrke og reducerer således evnen til at kvantificere effekten nøjagtigt. Kapitel 7 beskriver detaljeret de metoder, der er nødvendige for at vælge en passende stikprøvestørrelse til en CRT. Dette inkluderer metoder til uovertruffen, matchet, og stratificeret undersøgelsesdesign samt metoder til at vælge en passende prøvestørrelse for hver klynge.

funktioner, der kræver særlige metoder til Design og analyse

Inter-cluster korrelation og mellem-cluster variabilitet

i individuelt randomiserede forsøg antages individer at give statistisk uafhængige observationer i resultatet af interesse. Denne antagelse er imidlertid ikke sand i CRT ‘ er, da observationer af individer inden for den samme klynge har tendens til at være korreleret. Dette betyder, at viden om et individs resultat vil have en tendens til at give information om resultatet af et andet individ i samme klynge. Korrelation mellem klynger forekommer i CRT ‘ er af tre hovedårsager:

klyngedannelse af populationsegenskaber

der findes variationer mellem forskellige populationer på grund af forskelle i de individer, der udgør hver klynge, såsom demografiske eller socioøkonomiske egenskaber, eller på grund af forskelle i klyngeniveauvariabler såsom klyngens miljøegenskaber.

variationer i respons på Intervention

forskellige klynger kan reagere forskelligt på interventionerne, hvilket resulterer i variationer i resultaterne mellem klynger, selvom variationen i resultater mellem klynger var fraværende før interventionen.

korrelation på grund af interaktion mellem individer

Klyngelandomisering kan være særlig vigtig i forsøg med interventioner, hvor et individ i denne klynge enten kan have en direkte eller indirekte effekt på resultatet hos andre individer, såsom interventioner mod infektionssygdomme eller sundhedsuddannelsesprogrammer, hvor uddannelsesmeddelelser diskuteres af medlemmer af samfundet, der fører til ligheder i adfærd.

omfanget af korrelationen mellem klynger afhænger af eksistensen af andre klynger og klyngernes art og størrelse. Inter-cluster korrelation afhænger af eksistensen af andre klynger: det har ingen betydning, hvis der kun er en studiepopulation i en klynge under overvejelse. Derudover eksisterer det også kun, hvis der er ægte variation i resultaterne mellem klynger. Derfor kan korrelation mellem klynger og variabilitet mellem klynger betragtes som tilsvarende begreber, der giver to forskellige perspektiver på de samme underliggende fænomener. De slutninger, der kan foretages fra en CRT, afhænger af graden af variabilitet mellem klynger i resultatet af interesse, derfor, bør måles passende og overvejes i designet og analysen af en CRT. Der er to tilgange, hvormed variabilitet mellem klynger kan opsummeres: variationskoefficient mellem klynger og korrelationskoefficient inden for klynger. Disse beskrives grundigt i kapitel 2 i bogen.

ubalancer i undersøgelsesarm

på grund af praktiske og økonomiske begrænsninger er antallet af klynger randomiseret i en CRT ofte ret lille sammenlignet med antallet af individer, der typisk rekrutteres til et individuelt randomiseret forsøg. Med et lille antal klynger sikrer randomisering ikke, at de to arme er afbalancerede, så en ubalance mellem undersøgelsesarme på en eller flere potentielle forvirrende faktorer er en risiko, når man blot randomiserer et lille antal klynger. Designstrategier som matchning og stratificering kan bruges til at forbedre balancen mellem behandlingsarme og til at reducere variabilitet mellem klynger. Disse diskuteres i kapitel 5, og der gives også retningslinjer for, hvornår disse strategier skal anvendes.

matchning kan hjælpe med at minimere forskellene mellem behandlingsarme med hensyn til baseline-egenskaber og kan forbedre undersøgelsens styrke og præcision. Hvis der er betydelig variabilitet mellem klyngerne, kan det besluttes først at gruppere klynger, der forventes at være ens med hensyn til resultatet af interesse, og at fordele behandlingen inden for disse grupper. Gruppering af klyngerne i lignende par sikrer, at behandlingsarmene er ens ved baseline, i det mindste med hensyn til de egenskaber, vi vælger at matche på.

stratificering involverer gruppering af tilgængelige klynger i to eller flere lag, der forventes at være ens med hensyn til resultatet af interesse. Klyngerne inden for hvert lag fordeles derefter tilfældigt mellem behandlingsarmene. Stratificering har flere fordele i forhold til det matchede design.

matchede og stratificerede designs er eksempler på begrænset randomisering, da disse ordninger involverer tilfældigt valg fra et mindre sæt tildelinger, der opfylder visse begrænsninger.

selvom disse designs kan hjælpe med at reducere ubalancer mellem behandlingsarmene, er der omstændigheder, hvor de ikke kan påberåbes for at opnå tilstrækkelig balance, især når der er flere variabler, som balance er påkrævet. Under sådanne omstændigheder kan en anden tilgang til begrænset randomisering, der opnår den samlede balance mellem behandlingsarmene, anvendes. Samlet balance refererer til, når hver af variablerne er fordelt på samme måde på tværs af behandlingsarme og ikke kræver, at der er balance inden for undergrupper. Dette gøres ved hjælp af baseline eller allerede eksisterende data om hver klynge og begrænser til tildelinger, der opfylder visse forudbestemte balancekriterier. Kapitel 6 forklarer denne tilgang til begrænset Randomisering og beskriver de typer variabler, som balance ville være påkrævet, hvordan man definerer de balancekriterier, der ville begrænse tildelinger, og de omstændigheder, hvorunder re-optælling af tildelinger bør overvejes. Når der anvendes et begrænset randomiseringsskema, er der risiko for at producere et design, der er partisk eller ikke gyldigt, hvilket resulterer i standardmetoder til statistisk slutning, der giver forkerte resultater. Dette kapitel forklarer også, hvad der menes med bias og gyldighed, hvornår de kan forekomme, og hvordan man redegør for dem.

analyse

der er to hovedmetoder: analyse baseret på summariske målinger på klyngeniveau og analyse baseret på data på individuelt niveau ved hjælp af regressionsmetoder, der muliggør korrelationer mellem klynger.

det primære princip for begge disse metoder, at de tager højde for de to nøglefunktioner i CRT ‘ er, der blev diskuteret tidligere: korrelationer mellem klynger og tilfældige ubalancer mellem undersøgelsesarme som følge af et lille antal klynger.

bogen beskriver ikke alle de mulige metoder, der kan bruges til analyse af CRT ‘ er, men fokuserer snarere på dem, der har vist sig at være effektive og robuste i kapitel 9 – 12.

analysemetoden skal være passende til det specifikke design.

rapportering og fortolkning

der er et voksende antal beviser og erfaringer med klyngelandomiserede forsøg til vurdering af virkningen af interventioner på sundhedsresultater, og de udvidede CONSORT-retningslinjer er tilgængelige for at vejlede rapporteringen af sådanne forsøg:

Consort 2010 erklæring: udvidelse til klynge randomiserede forsøg.
Campbell MK, Piaggio G, Elbourne DR, Altman GD. Consort 2010 erklæring: udvidelse til klynge randomiserede forsøg.

Kapitel 15 i klyngen randomiserede forsøg bog af Hayes og Moulton diskuterer og forklarer CONSORT retningslinjer.

London School of Hygiene & Tropical Medicine