BAKGRUND
Kunskapsläget om olika sjukdomar och behandlingar har traditionellt sammanfattats i s k översiktsartiklar (engelska reviews). Sådana artiklar kan vara mycket informativa och läsvärda, men den vetenskapliga grunden för de slutsatser som presenteras är ofta dåligt redovisad. Sammanställningar av översiktsartiklar visar att den forskning som citeras ofta är ofullständig och vinklad, vilket kan leda till bias.
För att öka transparensen och minska risken för bias utvecklades metoden systematisk översikt. Systematiska översikter bygger på en strukturerad genomgång av den tillgängliga litteraturen. Datainsamling, kritisk granskning och analys görs enligt förutbestämda kriterier och redovisas öppet för läsaren. Resultaten sammanfattas ofta i s k metaanalys (se nedan). Eftersom systematiska översikter skall representera en balanserad och fullständig bild av den totala evidensen betraktas de ofta som den mest pålitliga formen av vetenskapliga studier.
Â
Systematisk översikt | Klassisk/narrativ översikt | |
Frågeställning | Specifik och tydligt definierad | Ofta bred och/eller dåligt definierad |
Litteratursökning | Omfattande, tydligt redovisad och reproducerbar | Ofta begränsad och/eller dåligt redovisad |
Metoder för hela processen | Explicit och reproducerbar | Varierande |
Genomförande | Flera forskare, delvis oberoende av varandra | Varierande |
Urval av studier | Enligt förutbestämda metodologiska kriterier | Ofta beroende på resultat snarare än metodologi |
Kritisk granskning av enskilda studier | Enligt särskild mall för samtliga studier | Ofta ofullständigt och olika för olika studier |
Syntes | Kvantitativ | Kvalitativ |
Tabell 1. Skillnader mellan systematisk och icke-systematisk översikt
BESKRIVNING AV METODEN
En systematisk översikt börjar med en fokuserad klinisk fråga. Utifrån denna fråga formuleras kriterier för vilka studier som bäst besvarar frågan. Det handlar dels om vilken studietyp som ger mest tillförlitliga resultat, där randomiserade kontrollerade studier (RCTs) (se PM EBM - RCT) har en särställning när det gäller frågor om behandlingseffekt. Dels specificeras patientgrupp, intervention, kontroll och utfall (ofta förkortat PICO från engelskans Patient Intervention Control Outcome).
Exempel: Du önskar få svar på om clopidogrel minskar risken att dö eller drabbas av ny hjärtinfarkt jämfört med ASA efter tidigare genomgången infarkt. Lämpliga studier att besvara en sådan frågeställning är RCTs som jämför clopidogrel mot ASA hos patienter med nyligen genomgången infarkt, där död eller re-infarkt analyseras som utfall. Uppföljningstiden bör vara i storleksordningen månader till år.
Utifrån de tidigare definierade kriterierna görs en genomgång av den tillgängliga litteraturen. Sökningar som ligger till grund för systematiska översikter är ofta omfattande och tidskrävande. Författarna går igenom flera olika medicinska databaser (exempelvis PubMed, CENTRAL och EMBASE), och inte sällan flera tusen referenser. Det övergripande målet är att inte missa något som är relevant (hög sensitivitet). I gengäld blir sökningarna ofta ospecifika och en övervägande majoritet av alla referenser kan sållas bort genom att läsa titlar och abstracts. Studier som potentiellt uppfyller de på förhand definierade inklusionskriterierna gås igenom i fulltext.
Exempel: En systematisk översikt av effekten av blodtryckssänkande behandling vid diabetes identifierade 14 434 artiklar i den elektroniska sökningen. 13 129 av dessa ansågs irrelevanta efter att ha screenat titlarna. Ytterligare 1070 artiklar sållades bort efter att ha läst abstract. 235 artiklar lästes i fulltext, av vilka 49 studier kunde inkluderas i analysen.
En viktig skillnad mellan klassiska/narrativa översiktsartiklar och systematiska översikter är att alla studier som uppfyller inklusionskriterierna genomgår en strukturerad kvalitetsbedömning, ofta kallad risk of bias-bedömning. I denna skattas studiernas interna validitet, d v s hur pålitliga resultaten anses vara (se PM EBM - kritisk granskning). Denna bedömning ligger sedan till grund för hur säkra slutsatser som kan dras från den systematiska översikten som helhet.
Exempel: En systematisk översikt fann 82 studier som uppfyllde inklusionskriterierna. Åtta av dessa ansågs ha hög risk för bias och exkluderades från analysen. Ytterligare fem studier hade brister som möjligen påverkade resultaten för enskilda utfall, varför slutsatserna för dessa utfall bedöms vara svagare.
En systematisk översikt är en sammanställning av resultat från tidigare genomförda studier. Data inhämtas således inte från patienter, journaler eller register, utan från tidigare publikationer. Om de data som krävs för att genomföra en systematisk översikt inte finns publicerade kan författarna kontakta forskare, företag eller myndigheter för att få tillgång till tidigare opublicerade data.
Både risk of bias-bedömning och dataextraktion skall göras av minst två forskare oberoende av varandra. Resultaten jämförs sedan för att hitta eventuella slarvfel. Många moment i risk of bias-bedömning och dataextraktion är mer eller mindre subjektiva, och ofta blir avstämningen också ett tillfälle att diskutera hur enskilda studier skall tolkas. Slutligen sammanfattas resultaten från de inkluderade studierna. Detta kan göras deskriptivt i text eller tabell, eller kvantitativt med hjälp av s k metaanalys.
METAANALYS
Metaanalys är ett samlingsnamn för statistiska metoder som väger samman resultat från enskilda studier. Metaanalys kan användas för både dikotoma och kontinuerliga variabler. Vi kommer här att fokusera på dikotoma variabler.
Exempel: En metaanalys av effekten av blodtryckssänkande läkemedel jämfört med placebo visade att behandlingen sänkte blodtrycket med 8,6 mmHg (kontinuerlig variabel). En annan metaanalys av samma studier visade att risken att drabbas av hjärt-kärlhändelser minskade med 22 % (dikotom variabel).
Det första steget i metaanalysen är att räkna ut behandlingseffekten i varje enskild studie. Studierna viktas sedan utifrån antalet deltagare och antalet kliniska händelser. Viktningen syftar till att större studier med fler händelser skall väga tyngre än små studier med färre händelser. Det är framför allt utfallets standardfel som avgör hur stor vikt en enskild studie får i metaanalysen. En studie med lågt standardfel i sitt utfall (eller med andra ord, hög precision i sitt resultat) får större vikt.
Metaanalysen räknar fram ett viktat medelvärde från de inkluderade studierna. Resultaten presenteras oftast som relativa risker eller oddskvoter med 95-procentiga konfidensintervall. Metaanalysen ger också information om olikheter i resultat mellan de enskilda studierna, s k heterogenitet. Ofta presenteras resultaten i en s k forest plot (figur 1 och 2 nedan).
Heterogenitet
Olika studier av samma intervention kan förväntas få olika resultat enbart beroende på slumpen. Å andra sidan är det meningslöst att slå ihop resultat från studier som är alltför olika – då bör man istället söka skillnader mellan studierna som kan förklara olikheterna i resultat!
Ett ofta använt mått på heterogenitet är I2 (läs I-squared). Resultatet är en procentsats som anger hur stor del av skillnaden i resultat mellan studier som INTE kan förklaras av slumpen. En tumregel är att:
- I2 < 25 % anses lågt
- I2 25–50 % anses måttligt
- I2 50-75 % anses högt och orsaken måste utredas, metaanalys kan vara olämplig
- I2 > 75 % metaanalys sannolikt olämplig
Låg heterogenitet är önskvärt. Vid värden > 50–75 % anses metaanalys olämpligt. Trots detta ser man ofta sådana värden i publicerade metaanalyser, vilket illustrerar vikten av att själv kunna tolka de resultat som presenteras!
Nedan ges två exempel på metaanalyser inklusive heterogenitetsmått. Under respektive figur följer tolkning av resultaten.
Â
Figur 1. De enskilda studierna är för små för att dra säkra slutsatser om behandlingseffekt. Metaanalysen finner dock en statistiskt signifikant riskreduktion och heterogeniteten är låg. Detta är ett exempel när metaanalys kan vara lämpligt och dessutom bidrar med ny information.
Â
Figur 2. Studie 2 och 4 är relativt stora och ger båda relativt precisa skattningar av behandlingseffekt (studie 2 visar på en riskreduktion och studie 4 på en riskökning). Heterogeniteten bekräftas av ett högt I2-värde. Här är det sannolikt mer informativt att söka skillnader mellan studierna än att slå ihop resultaten i en metaanalys.
Â
Small-study effect
Ett viktigt steg i metaanalysen är att undersöka om behandlingseffekten korrelerar med studiestorlek. Detta görs oftast med hjälp av funnel plots, där behandlingseffekt på x-axeln relateras till studieprecision på y-axeln. Stora studier med hög precision avviker endast i liten utsträckning från medeleffekten (resultatet från metaanalysen), samtidigt som små studier med låg precision kan avvika i större utsträckning endast beroende på slumpen. Detta ger en symmetrisk graf med utseendet av en uppochnedvänd tratt (figur 3).
Om majoriteten av små studier avviker åt samma håll jämfört med medelvärdet (figur 4) föreligger en s k small-study effect, vilket bör utforskas vidare. En orsak till sådant mönster är publication bias, vilket uppkommer då små studier med negativa resultat tenderar att publiceras i mindre utsträckning än små studier med positiva resultat.
Exempel: Av 74 RCTs som jämförde antidepressiva läkemedel mot placebo var 38 positiva och 36 negativa. Av 38 positiva studier var 37 publicerade i medicinska tidskrifter. Av 36 negativa studier var endast 14 publicerade, varav 11 vinklades som om resultaten vore positiva.
Â
STYRKOR OCH SVAGHETER
Systematiska översikter kan ge snabba och tillförlitliga svar på kliniska frågor. Väl genomförda representerar de en balanserad syntes av den sammanlagda evidensen. Styrkor med metaanalys är:
- Ökad statistisk styrka jämfört med enskilda studier
- Möjlighet att kvantifiera och analyser orsaker till skillnader i resultat mellan studier (heterogenitet)
Argument emot systematiska översikter och metaanalyser är ofta att de:
- Blandar äpplen och päron
- Missar relevant information
- Bortser från komplexiteten inom ett forskningsfält genom att låta en siffra representera hela fältet
Argumenten emot systematiska översikter bygger i stor utsträckning på missförstånd och felaktiga tolkningar av dess resultat.
- Frågeställningen i systematiska översikter är ofta bredare än i enskilda studier, varför inkluderade studier oundvikligen kommer att skilja sig åt avseende vissa karaktäristika (analogi – äpplen och päron kan kombineras vid frågor om frukt).
 - Information som bortses ifrån kan exempelvis vara mekanistiska studier, observationella samband eller effekter på surrogatmått (se PM EBM - kritisk granskning). Sådana studier ger mycket begränsad information om behandlingseffekt på patientviktiga utfall.
 - Systematiska översikter avser presentera och värdera tillgänglig evidens, samt kvantifiera samstämmigheten i dess resultat. Om resultaten är samstämmiga anges ett samlat effektmått för att öka precisionen, om resultaten är heterogena läggs större vikt vid att förstå orsakerna till heterogeniteten.
Referenser
Guyatt G, Rennie D, Meade MO, Cook DJ. Users' Guides to the Medical Literature: A Manual for Evidence-Based Clinical Practice. Third edition. New York: McGraw-Hill Education - Europe; 2015.
Higgins JPT, Green S (editors). Cochrane Handbook for Systematic Reviews of Interventions. Version 5.1.0 The Cochrane Collaboration, 2011. Länk
Hesser H, Andersson G. Metaanalys och systematiska översikter. Första upplagan. Lund: Studentlitteratur; 2015.