de flesta utvärderingar involverar bedömningen av interventioner som sker vid enheter som är större än hos individer. Dessa kan vara hälsosystem avrinningsområden, skolor, geografiska regioner eller till och med länder. I vissa fall är det lämpligt och möjligt att slumpmässigt fördela interventionen av intresse på nivån för dessa större enheter, och som sådan tillämpa den mest effektiva och tillförlitliga metoden för att minska förvirring.
viktiga resurser för att lära sig om randomiserade studier av kluster
en ny webbplats för randomiserade studier av kluster har utvecklats för att stödja dem som utför randomiserade studier av kluster och stegade kildesigner och de som utför metodforskning om dessa mönster. Webbplatsen har de senaste publikationerna, programvaran, diskussionerna och händelserna relaterade till clustered design.
denna bok av Richard Hayes och Lawrence Moulton har blivit den ledande metodtexten inom detta område:
Cluster Randomised Trials
Hayes R, Moulton L. Cluster randomised trials. Chapman och Hall / CRC Press, Boca Raton , FL, 2009
en kort sammanfattning av vad boken erbjuder tillhandahålls när det gäller dessa ämnen:
Rationale och begränsningar av randomiserade studier i kluster
det finns flera omständigheter där randomiserade studier i kluster är lämpliga och kan väljas framför andra randomiserade mönster. Vissa insatser är till sin natur avsedda att tillämpas på hela samhällen snarare än enskilda människor som utbildningsprogram eller förbättring av vattenförsörjningen i byar. Under vissa omständigheter erbjuder cluster randomisering mer logistisk bekvämlighet eller skulle tas emot med större acceptans när den levereras till hela befolkningen snarare än på individnivå. Cluster randomiserade försök är också ett effektivt sätt att undvika kontaminering och detta är en av de vanligaste orsakerna till att anta denna design. Slutligen tillåter CRTs att både de direkta och indirekta effekterna av en intervention fångas, vilket ger ett mått på den totala effekten av att genomföra en intervention i hela en befolkning. Detta är särskilt användbart när man överväger infektionssjukdomar. De som får interventionen drar nytta av både interventionens direkta effekt på mottagligheten för infektionen och de indirekta masseffekterna som resulterar i en minskning av exponeringen för infektionen.
när man överväger en randomiserad klusterdesign måste dessa fördelar vägas mot begränsningarna.Statistik och kostnadseffektivitet är viktigt att tänka på. Kraften och precisionen hos en randomiserad klusterstudie är lägre än en individuellt randomiserad studie, och de logistiska aspekterna av att arbeta i flera olika kluster kan göra en CRT dyr att implementera. Andra frågor att tänka på är urvalsförskjutning, obalans mellan studiearmar och generaliserbarhet. Motiveringen tillsammans med begränsningarna och strategierna för att minimera dem diskuteras i kapitel 3.
Designöverväganden
designval för Behandlingsarmar
parallell Gruppdesign
Detta är den vanligaste designen för både individuellt och kluster randomiserade studier. Under denna design förblir varje kluster i armen som det slumpmässigt tilldelades under hela försöket.
tre armförsök
med tanke på kostnaden och logistisk komplexitet associerad med CRT, och svårigheten att registrera tillräckligt med kluster för att ge en adekvat provstorlek i varje behandlingsarm, följer den stora majoriteten av CRT en studiedesign där kluster randomiseras till endast två behandlingsarmar. Trearmsförsök är ibland genomförbara, men CRT med mer än tre armar är mycket ovanliga. Men när de övervägs följer de två huvudmetoder: Den första jämför två olika ingrepp med en kontrollarm, och den andra jämför samma ingrepp som ges vid varierande intensitetsnivåer med en kontrollarm för att producera en dosresponsanalys.
faktoriella försök
konventionellt, för att uppskatta effekten av två interventioner skulle kräva antingen att utforma två försök eller genomföra en trearms försök, vilket har nackdelen med en mindre provstorlek i varje arm. Faktoriella mönster möjliggör studier av de oberoende effekterna av två interventioner i samma försök. Detta har fördelen av att vara kostnadseffektiv, och bevara provstorlek. Designen tar en 2 X 2 layout som resulterar i fyra behandlingsarmar: en arm som tar emot den första interventionen, en annan som tar emot den andra interventionen, en arm som tar emot båda interventionerna och slutligen en kontrollarm. Modellen resulterar i fyra behandlingsarmar, men uppskattning av effekten av varje ingrepp görs genom att jämföra en relevant kombination av två av armarna mot kombinationen av de återstående två armarna. Detta tillvägagångssätt är endast giltigt om det inte finns någon interaktion mellan interventionerna. Där interaktioner förväntas eller önskas kan faktoriella mönster användas för att identifiera den gemensamma effekten av två ingrepp, men större provstorlekar kan krävas.
Cross Over Design
syftet med denna design är att kontrollera för tidstrenden. Denna design används ofta i individuellt randomiserade försök och har antagits för CRT. Varje kluster får två behandlingar, en efter den andra. Det finns ofta en period däremellan som kallas wash-out-perioden för att undvika överföringseffekter.
stegad Kildesign
Klicka här för att lära dig mer om denna design.
typ och storlek på kluster
ett av de första besluten som ska fattas vid utformningen av en CRT avser valet och definitionen av de kluster som ska randomiseras under försöket. Det finns en mängd olika typer och storlekar av kluster som sträcker sig från familjer eller hushåll med några individer, till stora geografiska områden som innehåller miljontals individer. De praktiska delarna av genomförandet av sådana försök är väldigt olika. Kapitel 4 behandlar de olika typerna av studiekluster och diskuterar de viktigaste frågorna som ska beaktas vid val av klusterstorlek.
kontaminering
kontaminering uppstår när svar i ett kluster förvrängs på grund av kontakt med individer utanför klustret, och detta kan fortfarande inträffa och utgöra ett viktigt problem i CRT. Detta kan hända på grund av kontakt mellan interventionskluster och kontrollkluster. Det kan också hända på grund av kontakt mellan interventionskluster eller kontrollkluster och den bredare befolkningen. Strategier för att minska graden av förorening i en CRT inkluderar att välja kluster som är tillräckligt avlägsna och väl separerade från var och en. Under omständigheter när geografiska zoner tilldelas antingen interventions-eller kontrollarmarna snarare än specifika samhällen används buffertzoner för att kluster inte har en gemensam gräns mellan dem. Dessa två strategier används för att säkerställa att kontaminering inte uppstår mellan interventions-och kontrollkluster. Fried egg design är en strategi som används för att minska kontakten mellan interventions-eller kontrollkluster och den bredare befolkningen. De sätt på vilka kontaminering sker och strategierna för att minska dem diskuteras vidare i kapitel 4.
metoder för att mäta resultat från individer
resultaten av intresse mäts från ett urval av individer valda från varje kluster. Det finns två huvudsakliga tillvägagångssätt för att mäta individer, beroende på resultatet: tvärsnittsundersökningar eller kohorter. En fullständig diskussion om när var och en kan användas och deras fördelar och nackdelar finns i kapitel 8.
upprepade tvärsnittsprover
Tvärsnittsundersökningar kräver att man tar ett upprepat prov från varje kluster vid olika tidpunkter. Det används när måttet på resultatet är ett binärt resultat (såsom HIV eller rökning prevalens) eller en kvantitativ slutpunkt (såsom medelkolesterolnivå eller medelhöjd hos barn).
kohort uppföljning
kohortmetoden innebär att följa upp utvalda individer över tiden. Detta används när måttet på utfallet är en hastighet eller risk för händelser som inträffar under en angiven uppföljningsperiod. Kohorten kan bestå av den totala populationen i ett kluster eller ett slumpmässigt urval från det klustret. När den totala befolkningen ska följas upp måste det anges om nya personer som kommer in i befolkningen vid ett senare tillfälle kommer att övervägas eller att begränsa studien till endast de som ses vid baslinjen.
provstorlek
vid utformning av en CRT är provstorlek en av de viktigaste faktorerna att överväga. Otillräcklig provstorlek ökar det slumpmässiga felet, minskar studiens kraft och minskar därmed förmågan att kvantifiera effekten exakt. Kapitel 7 anger i detalj de metoder som behövs för att välja en lämplig provstorlek för en CRT. Detta inkluderar metoder för oöverträffade, matchade och stratifierade studiedesigner samt metoder för att välja en lämplig provstorlek för varje kluster.
funktioner som kräver speciella metoder för Design och analys
Inter-cluster korrelation och mellan-cluster variabilitet
i individuellt randomiserade studier antas individer ge statistiskt oberoende observationer i resultatet av intresse. Detta antagande är dock inte sant i CRT eftersom observationer på individer inom samma kluster tenderar att korreleras. Detta innebär att kunskap om en individs resultat tenderar att ge information om resultatet av en annan individ i samma kluster. Inter-cluster korrelation förekommer i CRT av tre huvudorsaker:
Clustering of population characteristics
variationer finns mellan olika populationer på grund av skillnader i individerna som utgör varje kluster, såsom demografiska eller socioekonomiska egenskaper, eller på grund av skillnader i klusternivåvariabler, såsom miljöegenskaper hos klustret.
variationer som svar på Intervention
olika kluster kan svara annorlunda på interventionerna vilket resulterar i variationer i resultaten mellan kluster även om variationen i resultat mellan kluster var frånvarande före interventionen.
korrelation på grund av interaktion mellan individer
Cluster randomisering kan vara särskilt viktigt i försök med interventioner där en individ i det klustret kan ha antingen en direkt eller indirekt effekt på resultatet hos andra individer, såsom interventioner mot infektionssjukdomar eller hälsoutbildningsprogram där utbildningsmeddelanden diskuteras av medlemmar i samhället som leder till likheter i beteende.
omfattningen av korrelationen mellan kluster beror på förekomsten av andra kluster och klusterens natur och storlek. Inter-cluster korrelation beror på förekomsten av andra kluster: det har ingen betydelse om det bara finns en studiepopulation, i ett kluster, under övervägande. Dessutom finns det bara om det finns sann variation i resultaten mellan kluster. Därför kan inter-cluster korrelation och mellan-cluster variabilitet ses som motsvarande begrepp som ger två olika perspektiv på samma underliggande fenomen. De slutsatser som kan göras från en CRT beror på graden av variation mellan kluster i resultatet av intresse, således, bör mätas på lämpligt sätt och beaktas i utformningen och analysen av en CRT. Det finns två tillvägagångssätt genom vilka variabilitet mellan kluster kan sammanfattas: variationskoefficient mellan kluster och korrelationskoefficienten inom kluster. Dessa diskuteras grundligt i kapitel 2 i boken.
obalanser i Studiearmen
på grund av praktiska och ekonomiska begränsningar är antalet randomiserade kluster i en CRT ofta ganska litet jämfört med antalet individer som vanligtvis rekryteras till en individuellt randomiserad studie. Med ett litet antal kluster säkerställer randomisering inte att de två armarna är balanserade, så en obalans mellan studiearmarna på en eller flera potentiella förvirrande faktorer är en risk när man helt enkelt randomiserar ett litet antal kluster. Designstrategier som matchning och stratifiering kan användas för att förbättra balansen mellan behandlingsarmar och för att minska variationen mellan kluster. Dessa diskuteras i kapitel 5 och riktlinjer för när dessa strategier ska användas finns också.
matchning kan hjälpa till att minimera skillnaderna mellan behandlingsarmarna med avseende på baslinjens egenskaper och kan förbättra effekten och precisionen i studien. Om det finns betydande skillnader mellan kluster kan det beslutas att först gruppera kluster som förväntas vara likartade med avseende på resultatet av intresse och att fördela behandlingen inom dessa grupper. Att gruppera klustren i liknande par säkerställer att behandlingsarmarna är lika vid baslinjen, åtminstone med avseende på de egenskaper vi väljer att matcha.
stratifiering innebär gruppering av tillgängliga kluster i två eller flera skikt som förväntas vara lika med avseende på resultatet av intresse. Klusterna inom varje stratum fördelas sedan slumpmässigt mellan behandlingsarmarna. Stratifiering har flera fördelar jämfört med den matchade designen.
matchade och stratifierade mönster är exempel på begränsad randomisering eftersom dessa system innebär att man slumpmässigt väljer från en mindre uppsättning allokeringar som uppfyller vissa begränsningar.
även om dessa mönster kan bidra till att minska obalanserna mellan behandlingsarmarna, finns det omständigheter där de inte kan åberopas för att uppnå tillräcklig balans, särskilt när det finns flera variabler som balans krävs. Under sådana omständigheter kan ett annat tillvägagångssätt för begränsad randomisering som uppnår övergripande balans mellan behandlingsarmarna användas. Övergripande balans avser när var och en av variablerna fördelas på samma sätt över behandlingsarmarna och kräver inte att det finns balans inom undergrupper. Detta görs med hjälp av baslinje eller redan existerande data på varje kluster och begränsar till allokeringar som uppfyller vissa förutbestämda balanskriterier. I kapitel 6 förklaras detta tillvägagångssätt för begränsad randomisering och beskrivs de typer av variabler som balans skulle krävas på, hur man definierar balanskriterier som skulle begränsa tilldelningar och de omständigheter under vilka omräkning av tilldelningar bör övervägas. När ett begränsat randomiseringsschema används finns det risk för att man producerar en design som är partisk eller inte giltig, vilket resulterar i standardmetoder för statistisk slutsats som ger felaktiga resultat. Detta kapitel förklarar också vad som menas med partiskhet och giltighet, när de kan inträffa, och hur man redogör för dem.
analys
det finns två huvudmetoder: analys baserad på sammanfattande åtgärder på klusternivå och analys baserad på data på individnivå med regressionsmetoder som möjliggör korrelationer mellan kluster.
den primära principen för båda dessa metoder att de tar hänsyn till de två nyckelfunktionerna i CRTs som diskuterats tidigare: Inter-cluster korrelationer och chans obalanser mellan studiearmar som härrör från ett litet antal kluster.
boken beskriver inte alla möjliga metoder som kan användas för analys av CRT, utan fokuserar på de som har visat sig vara effektiva och robusta i kapitel 9 – 12.
analysmetoden bör vara lämplig för den specifika utformningen.
rapportering och tolkning
det finns en växande mängd bevis och erfarenhet av kluster randomiserade försök för att bedöma effekterna av interventioner på hälsoutfall, och de utökade KONSORTRIKTLINJERNA är tillgängliga för att styra rapporteringen av sådana försök:
Consort 2010 uttalande: förlängning till kluster randomiserade försök.
Campbell MK, Piaggio G, ELBOURNE DR, GD Altman. Consort 2010 uttalande: förlängning till kluster randomiserade försök.
Kapitel 15 i Cluster Randomized Trials book av Hayes och Moulton diskuterar och förklarar CONSORT-riktlinjerna.