Analyse: Virker hydroxyklorokin mod covid-19?

Kristian Francisco Milla Nielsen
23 min readOct 28, 2020

--

I Danmark bruges to lægemidler i kampen mod covid-19. Det drejer sig om remdesivir, som er et anti-viralt middel der injiceres lige før respiratorstadiet samt det immunhæmmende steroid dexamethason, der bruges i respiratorstadiet for at dæmpe den reelle dræber: cytokinstormen.

Når først man er hospitaliseret med covid-19 er dødeligheden meget høj (13,1%) som illustreret i nedestående diagram:

Fra Palazzouli et al.

Coronastrategien om at ”knække kurven” handler i virkeligheden ikke om at forhindre coronasmitte, men derimod om at fordele smitten udover længere tid således at en overophedning af sundhedsvæsenets kapacitet undgås. En overophedning er noget der ikke kun får dødeligheden hos coronasmittede til at stige markant — men også hos andre syge som der bliver færre ressourcer til. Det er altså alfa omega at undgå hospitaliseringerne.

Som sendt fra himlen påstår en række mikrobiologer, læger og epidimologer at lægemidlet hydroxyklorokin er effektivt mod covid-19 i det ambulante stadie; i starten af sygdommen. At midlet tilsyneladende kan slå ned på sygdommen før den udvikler sig og dermed kræver hospitalisering. Dets fortalere er eksempelvis Dider Raoult (den mest citerede mikrobiolog i Europa) og Harvey Risch (professor i epidemiologi på Yale University).

Hvad hvis hydroxyklorokin rent faktisk virker? Hvad hvis det var billigt og ufarligt? Hvad hvis det allerede var tilgængeligt i store mængder herhjemme? Du tænker nok, at hvis ovenstående rent faktisk var tilfældet — så ville det for længst været implementeret i Danmark. Hvis det rent faktisk var tilfældet, ville det skade den påskønte tillid til institutionerne i Danmark. Det noget vi alle — jeg inklusivt — ikke ønsker.

Der er 105 behandlingskandidater mod covid-19 og to af dem bruges i Danmark. I denne analyse vil jeg prøve at besvare spørgsmålet: Skulle der have været brugt tre?

Sagen om hydroxyklorokin er blevet politiseret utrolig meget. Jeg vil forsøge at bringe en objektiv analyse hvor jeg vil dykke ned i argumenterne for og imod.

Hurtigt om hydroxyklorokin

Hydroxyklorokin (HCQ) er den behandlingskandidat der har klart den største litteratur bag sig i forbindelse med covid-19. Der er udgivet 154 studier på verdensplan og 91 af dem af peer reviewed (ikke at dette er en blåstempling, overhoved). Til sammenligning er der udgivet 5 for remdesivir.

Hydroxyklorokin bliver anvendt mod malariaparasitten og er et derivat af klorokin der har været brugt siden 1934. Det er dog et bredtfavnende middel som også bliver anvendt mod samlet 24 andre lidelser såsom gigt. HCQ er en del af WHO’s “List of Essential Medicines”.

Nogle hurtige begreber før vi går videre

Resultatvariabel:
Når man laver studier måler man på nogle variable. Det kan være dødelighed, hospitalsering, indlæggelsestid, viruskoncentration over tid mm.

RR: Relative risk.
Disse resultatvariabler sammenlignes mellem grupperne via RR. RR er forholdet mellem risikoen for et udfald i to forskellige grupper (fx: risiko for død i en kontrolgruppe og en HCQ-gruppe). En RR på 1 betyder ingen forskel i risiko. Over 1 sker der en forøgelse af risiko og under 1 formindskes risikoen. Eksempelvis betyder en RR på 0,4 at risikoen er 60% mindre for den ene gruppe.

P-værdi:
P-værdien er sandsynligheden for at en række observationer skyldes tilfældigheder. Hvis man vender en mønt 4 gange og får plat alle gange kan man mistænke at mønten har en indvirkning på resultatet (snydemønt). P-værdien for det observerede var = 0,5 x 0,5 x 0,5 x 0,5= 0,0625 = 6,25%. Det kan hjælpe os med at besvare mistanken. På samme måde kan p-værdien beregne sandsynligheden for at den observerede forskel i grupperne i studiet skyldtes tilfældigheder.

Modstanderne af HCQ

I Danmark bestemmer Lægemiddelstyrelsen hvilket medicin, som skal indsættes mod hvilke sygdomme. Det er ganske lidt styrelsen har udgivet om deres vurdering af HCQ ift covid-19 selvom de “løbende opdaterer en liste over studier og forskning i medicin mod covid19 verden over og følger den nyeste viden tæt”. Så på trods af minimal kommunikation om disse løbende vurderinger, må det antages at de udfører dem nøje. Det sidste de har publiceret om HCQ og covid-19 er fra den 5. juni:

“‘Flere observationelle studier af mindre omfang har indikeret sikkerhedsproblemer ved brug af hydroxyklorokin mod Covid19. Sagen om tilbagetrækningen af Lancet-artiklen (Mehra et al. — et stort studie der konkluderede større risiko for død via HCQ og som var fusket og blev tilbagetrukket, red.) ændrer ikke på, at der fortsat skal være stort fokus på sikkerheden for forsøgspersoner i kliniske forsøg med hydroxyklorokin mod Covid-19.

Vi ved ikke endnu, om hydroxyklorokin virker mod Covid19. Vi ved heller ikke, om covid19-patienter, som typisk er ældre og svage medborgere, tager skade af at bruge medicinen. Det er en sårbar patientgruppe, det handler om, så ligesom ved alle andre forsøg skal vi derfor selvfølgelig være omhyggelige for forsøgspersonernes og patienternes skyld, når vi fra Lægemiddelstyrelsens side godkender kliniske forsøg,’ siger Thomas Senderovitz.”

Derudover bliver der på Lægemiddelstyrelsens hjemmeside under temaet “Vacciner og medicin til behandling mod COVID-19” (som kan findes på deres forside) henvist til Rationel Farmakoterapi’s rapport: “Information til læger om status af mulig forebyggelse og behandling af COVID-19”. I rapporten gennemgås evidensen og litteraturen for flere forskellige lægemidler mod covid-19. Her sammenfatter de om HCQ: “In vitro studier indikerer, at hydroxychloroquin kunne have effekt mod SARS-CoV-2. Der foreligger dog endnu ingen publicerede kliniske studier, der dokumenterer effekten af hydroxychloroquin til COVID-19”. Rapporten er dog fra den 20. marts og altså meget uaktuel i det der på dette tidspunkt kun var udgivet 14 studier (4 af dem var kliniske studier, fra Kina, hvor to var positive — i stor kontrast til påstanden i citatet).

I forlængelse heraf indskærpede Lægemiddelstyrelsen den 26. marts 2020 tilgængeligheden af hydroxyklorokin i samfundet for “at sikre mod uhensigtsmæssige ordinationer”. I praksis betød det at apoteker kun måtte acceptere recepter fra sygehuslæger, hudlæger eller gigtlæger samt at kunden skulle have et bevis for ledgigt eller systemisk lopus. Den 19. oktober blev restriktionen dog ophævet.

Til sidst har Dansk Selskab for Infektionsmedicin lavet en behandlingsvejledning mod covid-19 som er opdateret den 13. okt 2020 og derfor er klart mere aktuel. Udover at anbefale remdesivir og dexamethason skriver de om HCQ: “Der er ikke evidens til at anbefale anden antiviral behandling eller antiinflammatorisk behandling. Hydroxyklorokin (+/- Azithromycin) og Lopinavir/Ritonavir frarådes som behandling mod COVID-19”. Den påtalte evidens er en henvisning til følgende 3 studier der alle er såkaldte “lodtrækningsforsøg” (Randomized Control Trials = RCT’s):

  1. Cavalcanti et al. (23. juli).
  2. Tang et al. (14. maj).
  3. Horby et al. (RECOVERY trial — 5. juni).

Disse tre studier kommer vi ind på senere i figur 1.

Når det drejer sig godkendelse af lægemidler mod smitsomme sygdomme skriver Lægemiddelstyrelsen at det “foregår i EU via den såkaldte centrale procedure. Det vil sige, at det skal indsendes til Det Europæiske Lægemiddelagentur (EMA), som vurderer medicinen på vegne af alle landene i EU”. Lad os derfor kigge på EMA’s vurdering af HCQ.

Det er ikke meget EMA kommunikerer omkring dette på trods af stor selvpromovering af deres “exceptional transparency measures”. Det sidste opdaterede element på deres hjemmeside der omhandler HCQ er fra den 29. maj:

“These medicines (hydroxyklorokin og klorokin, red.) have not shown any beneficial effects in treating COVID-19 in the relevant treatment arms of ongoing large randomised clinical trials (e.g. the Solidarity trial, the Recovery trial and the Discovery trial). Chloroquine and hydroxychloroquine may cause certain side effects, including heart rhythm problems.”

Som EMA siger, mangler der altså positive resultater fra store kliniske, randomiserede forsøg. Dem har der med rette ikke været mange af, da det kræver stort samarbejde og koordinering mellem mange hospitaler, forskere og læger — noget som ofte kun kan varetages på statsniveau.

De tre eneste af sådanne forsøg er døbt RECOVERY (engelsk), DISCOVERY (fransk)og SOLIDARITY (WHO). RECOVERY havde en negativ konklusion på HCQ. DISCOVERY stoppede sin HCQ-arm den 17. juni pga dårlige resultater, men har endnu ikke udgivet disse. SOLIDARITY stoppede også sin HCQ-arm den 4. juli på grund af “lille eller ingen målt effekt”.

Hen af samme linje er WHO’s dom på hydroxyklorokin således (fra den 31. juli):

WHO’s ståsteder og guidelines bygger i høj grad på metaanalyser fra Cochrane, som er et internationalt netværk af forskere og institutioner, der gennemtjekker information fra hele verden om effekten af forskellige behandlinger. Cochrane har udgivet 2 af sådanne analyser omhandlede hydroxyklorokin og covid-19.

Den 11. juni foretog Cochrane på vegne af WHO en analyse af litteraturen (dog kun 5 studier) og kom frem til følgende konklusion:

“The current evidence on the efficacy and safety of hydroxychloroquine for the treatment of COVID-19 is limited and of very low certainty. Hydroxychloroquine was not associated with a difference in overall mortality when compared to standard care for the treatment of COVID-19. Limited evidence suggested that hydroxychloroquine may result in more adverse events than standard care for treatment of COVID-19.”

Den 11. juni er i epidemisammenhæng lysår tilbage. Cochrane Australien tilbyder derimod en up-to-date metaanalyse af HCQ. Cochrane Australien er med i Australiens nedsatte gruppe til at vurdere covid-19 behandlinger — The National COVID-19 Clinical Evidence Taskforce. Deres vurdering af HCQ er opdateret den 15. oktober 2020. De konkluderer:

“Based on the available evidence, hydroxychloroquine is potentially harmful and no more effective than standard care in treating patients with COVID-19. We therefore recommend that hydroxychloroquine should not be used.”

Metaanalysen viste, at HCQ forøgede risikoen for at dø med 7% (RR 1.07, 95% konfidensinterval: 0.97-1.18). Deres metaanalyse byggede på data fra 11 studier (i alt 6300 patienter), hvor langt størstedelen af evidensen dog kom fra RECOVERY-studiet (4716 patienter). I beregnelsen af dødelighedsvariablen vægtede RECOVERY’s resultater med 98%.

I Storbritannien konkluderer deres lægemiddelstyrelse (MHRA) følgende på baggrund af to studier:

“The MHRA took into consideration the results released from the RECOVERY trial, showing no beneficial effect of hydroxychloroquine in patients hospitalised with COVID-19, and a New England Journal of Medicine publication (Boulware et al., red.) using hydroxychloroquine as postexposure prophylaxis of COVID-19, concluding that hydroxychloroquine did not prevent illness compatible with Covid-19 or confirmed infection.”

Også det amerikanske National Institutes of Health (NIH) anbefaler imod HCQ:

“The Panel recommends against the use of HCQ with or without AZM for the treatment of COVID-19 in hospitalized patients (AI).
In nonhospitalized patients, the Panel recommends against the use of HCQ with or without AZM for the treatment of COVID-19, except in a clinical trial (AI).”

NIH kommer med en grundigere argumentation for sin anbefaling (opdateret den 9. oktober 2020). De lavede en systemisk gennemgang af litteraturen (systemic review). Udover at henvise til de tre samme RTC’s som Dansk Selskab for Infektionsmedicin medtog de 4 andre RCT’s (Furtado et al., Borba et al., Skipper et al. og Mitja et al.). Tilmed inkluderede de 3 observationelle studier (Geleris et al., Rosenberg et. al og Mahevas et al.).

Alle disse medtagede studier havde en negativ konklusion. Til sidst tilføjede de en gendrivelse i form af det observationelle studie Arshad et al. som konkluderede at dødeligheden faldt med 51,3% (p=0,009), men man konkluderede at denne ikke opvejede evidensen fra de andre studier.

Problemerne med modstandernes argumentation

Håndplukning af studier

Der er altså i store dele af vesten en klar konsensus om at HCQ ikke virker mod covid-19. Men når man kigger på argumentationen er det tydeligt, at det bygger på en brøkdel af litteraturen.

Dansk Selskab for Infektionsmedicin henviste til konklusionen fra tre studier for ikke at anbefale HCQ. FDA lavede en systemisk gennemgang af 10 studier mens den australske covid-taskforce, som har lavet den mest gennemgribende metaanalyse, kun byggede sin analyse på 9% af hele litteraturen (11 studier).

Der er udgivet hele 121 eksperimentielle eller observationelle studier af HCQ mod covid-19 — som alle kan ses her. Det er videnskabelig praksis at fravælge partiske og utroværdige studier når man laver en metaanalyse (eller systemisk gennemgang), men i dette tilfælde lader der måske mere til at være tale om selektiv udvælgelse af studier fremfor objektiv fravælgelse.

Nedeunder ses fordelingen af resultaterne fra alle eksperimentielle og observationelle studier om HCQ og covid-19.

Alle eksperimentielle og observationelle studier om HCQ fordelt på RR for den vigtigste variabel for hvert studie. Det skal tilføjes at mange af disse resultater er insignifikante (kan ikke udelukkes at udsvinget mellem HCQ og kontrol skyldes tilfældigheder)

Konklusionerne fra beslutningstagere i store dele af vesten bygger næsten udelukkende på de eksperiementielle studier der kaldes Randomized Control Trials (RCT’s). Dem er der lavet 20 af (per 23/10–20). Anthony Fauci (leder af NIH) udtalte således i nedestående klip fra den 29. juli: “I look at the evidence. And data from all trials that were randomized and controlled in a proper way show consistently that hydroxychloroquine is not effective against covid-19”.

Udtalelsen afspejler hvad Harvey Risch, professor i epidimologi på Yale University, kalder en RCT-fundamentalisme i vesten. En tendens til at sætte lighedstegn mellem evidens og RCT’s. Hvorfor er RCT’s så foretrukne?

RCT’s er gode til sænke bias. De er gode til at sænke antallet af forstyrrende variable der kan spille ind på resultatet. De er dog dyre og tidskrævende hvilket er grunden til at der er lavet 5 gange så mange observationelle studier om HCQ og covid-19.

I observationelle studier gransker forskerne eksisterende databaser (patientregistre, journaler mm) og leder efter sammenhænge blandt variable. Det kan være man har samlet data om nogle mennesker der var indlagt for samme sygdom. Nogle af dem har fået et medikament og således ville man eksempelvis kunne udregne dødeligheden for dem der fik det, og dem der ikke fik det. Men måske var grunden til at dem der fik medikamentet, at de var ekstra syge. Det er en forstyrrende variabel. Således kan det være at man har fundet ud af, at folk der er ekstra syge har større risiko for at dø fremfor at medicinen gør skade. Så selvom der er korrelation er der ikke nødvendigvis kausalitet i observationelle studier. Denne risiko er RCT’s gode til at nedsætte.

Anton Pottegård der er professor i farmakoepidemiologi på SDU er bekymret over de observationelle studier der tilskriver effektivitet til et medikament mod covid-19 “da det er noget som er meget svært gøre ordenligt og derfor bør overlades til RCT’s”. Han kommer med et eksempel på et dårligt lavet observationelt studie af HCQ her (Lagier et al.).

NIH skriver ligeledes i sin fortolkning af HCQ-litteraturen, at de observationelle studier i høj grad ses bort fra:

“Many of the observational studies that have evaluated the use of chloroquine or hydroxychloroquine in patients with COVID-19 have attempted to control for confounding variables. However, study arms may be unbalanced in some of these studies, and some studies may not account for all potential confounding factors. These factors limit the ability to interpret and generalize the results from observational studies; therefore, results from these studies are not as definitive as those from large randomized trials.”

På den anden side har en analyse af forskere fra Oxford vist at kun 10% af Cochranes anbefalinger fra 2015–19 bygger på evidens fra flere positive RCT’s (den såkaldte “gold standard”). En anden undersøgelse af kardiologi-medicin viste at kun 14,3% af anbefalingerne fra European Society of Cardiology (ESC) byggede på “gold standard”.

Betyder det så, at meget af den medicin vi får for andre lidelser ikke nødvendigvis virker? Ikke ifølge en enorm metaanalyse der sammenlignede resultaterne af 2492 observationelle studier og RCT’s fordelt på 228 lidelser. Analysen konkluderede:

“…there is little evidence for significant effect estimate differences between observational studies and RCTs, regardless of specific observational study design, heterogeneity, or inclusion of studies of pharmacological interventions.”

Denne konklusion stemmer overens med Kovesdy et al. som skriver:

“Experiments such as RCTs are in fact themselves merely observations; what distinguishes them is the apparent control that we believe we have over the circumstances of the observations. However, RCTs too are subject to a number of fallacies (vide infra) which could render their results invalid or questionable. It is thus naive to look at RCTs as a universal panacea that will always tell us what is right or what is wrong; as it is also simplistic to question the validity of observational studies merely because of their nonexperimental and non-randomized nature.”

Det kan derfor virke uhensigtmæssigt at nedjustere puljen af potentiel viden fra 121 studier til 20, fordi man insisterer på RCT’s overlegenhed.

Dette fænomen er bestemt ikke kun knyttet til covid-19 og HCQ. I 2017, tre år før covid-19, skrev den tidligere leder af Center for Disease Control (CDC), Thomas Frieden, en artikel i New England Journal of Medicine om nøjagtig den samme tendens:

“Current evidence-grading systems are biased toward RCTs, which may lead to inadequate consideration of non-RCT data.Objections to observational studies include the potential for bias from unrecognized factors along with the belief that these studies overestimate treatment effects…
This line of reasoning does not suggest that the Food and Drug Administration should be less stringent in their review of drug safety and efficacy, but rather that there should be rigorous review of all potentially valid data sources.”

Frieden pointede derudover i artiklen at specielt i epidemiske situationer kan RCT-urokkelighed være problematisk: “…These limitations also affect the use of RCTs for urgent health issues, such as infectious disease outbreaks, for which public health decisions must be made quickly on the basis of limited and often imperfect available data.”

Der er udgivet 95 observationelle studier om HCQ og covid-19. 69 af dem viste en positiv effekt for den vigtigste resultvariabel og 26 viste en negativ effekt. Alligevel koges argumentationen imod HCQ blandt vestlige myndigheder ned til højst 11 studier kun bestående af RCT’s (med få undtagelser). Håndplukning af studier der bekræfter ens pointe er et gennemgående problem i hele det her HCQ-cirkus. Både blandt dem der for og imod. Der er brug for en omfattende fortolkning af HELE litteraturen.

Insignifikans = ingen virkning?

Hvis hydroxyklorokin rent faktisk virkede mod covid-19 så burde man også kunne se det i RCT’s. Det er en fair antagelse. Lad os derfor kigge på konklusionerne fra de 20 offentliggjorte RCTs (negative konklusioner er røde og positive er grønne):

Figur 1: Positiv/negativ alt efter fortolkning (lavet den 23 oktober)

Altså konkluderer forfatterne i 16 ud af 20 RCT’s at HCQ ikke ser ud til at have en effekt. Vigtigst af alt konkluderes det i de to største studier RECOVERY og SOLIDITARY. Derudover konkluderes det også i de næststørste studier Mitja, Skipper og Cavalcanti et al.

Hvis man dykker ned i studiernes faktiske resultater og kigger på hvilke tal man er kommet frem til i studiernes resultatvariabler ser man et næsten diametralt modsat billede. HCQ har haft en lutter positiv effekt i 14 ud af 20 studier og blandede positive/negative effekter alt efter resultatvariabel i 2 andre (de orange):

Figur 2: Positiv/negativ alt efter målt effekt

Hvorfor denne diskrepans mellem resultat og fortolkning? Svaret bunder i signifikans. Lad os eksempelvis dykke ned i Mitja et al., hvor der konkluderes: “no benefit was observed with HCQ”. Studiet bruges bl.a. af NIH i deres argumentation mod HCQ.

I studiet var der 8 ud af 128 i HCQ-armen der kom på hospitalet og 12 ud af 143 i kontrol-armen der kom på hospitalet. Det svarer til en RR på 0,75 for HCQ-armen. Men kan det ikke ligeså godt skyldes en tilfældighed? Jo! Derfor bruger vi p-værdien til at fortælle os hvad sandsynligheden er for at udsvinget skyldtes en tilfældighed (og nulhypotesen antages at være sand: HCQ=kontrol):

Figur 4 (Geogebras sandsynlighedslommeregner)

Her er p-værdien altså 0,516. Det betyder at der er godt 50% sandsynlighed for, at det ligeså godt kunne skyldes statistisk tilfældighed. Lærefrasen er at når først der er mindre end 5% sandsynlighed for tilfældighed vil man stole på medikamentets virkning. Det kaldes signifikansniveauet. Så hvor mange indlæggelser i HCQ-armen skulle der hypotetisk have været i datasættet før p-værdien kom under 0,05 og man dermed ville stole på medikamentet? Det kan vi se i nedestående graf:

Figur 5 (Excel)

Her kan det ses, at med datasættets størrelse skal vi ned på 3 indlæggelser i HCQ-armen (og stadig 12 i kontrolarmen) før vi tror på, at medicinen rent faktisk har en effekt. Det vil sige at når først RR er 0,28 eller under— sagt på en anden måde; når først medikamtentet har en effektivitet på 72% eller over tror vi på den virker. Hvis den målte effekt var en 20%, 30% eller — i dette tilfælde — 25% ville det ikke være nok. Det er problemet med medikamenter der ikke er mirakelkure, men som (potentielt) virker: de er svære at bevise.

I dette tilfælde er udfaldsrummet så lille (henholdsvis 8 og 12 indlæggelser) at de sagtens kunne skyldes tilfældigheder — hvorfor p-værdien på 0,51. Vi kan med god grund ikke konkludere noget på baggrund af dette. Heller ikke at HCQ ikke har nogen “benefit”, som forfatterne konkluderer.

Tag Boulware et al. som andet eksempel. Her målte man samlet en 18% mindre risiko for infektion i HCQ-gruppen, men p-værdien var 0,35. Der er altså næsten 2/3 chance for, at det ikke skyldes tilfældighed. Istedet for at konkludere at “HCQ did not prevent illness” (pga p-værdi over 5%), burde man istedet havde konkluderet noget nærmere: “The results are more compatible with a decrease in risk of infection”.

Prøver jeg — en 20-årig grønskoling — at bilde dig ind, at forskerne bag de fleste af studierne har fortolket deres data forkert? Det er jo absurd! Ja, det prøver jeg. Prøver jeg at sige, at de skulle have konkluderet, at HCQ virker? Heller ikke. Man skulle i stedet have konkluderet at resultaterne er mere kompatible med en positiv virkning fremfor tilfældighed.

Problemet er, at omend læger er dygtige til deres fag, er de ikke matematikere. Næsten på ligefod med princippet om RCT’s overlegenhed, lader der til at være en afstivet forståelse af signifikans. Den indiske professor Chittaranjan Andrade, påtaler problemet:

“Next, imagine that instead of obtaining P = 0.04, you obtained P = 0.14 in the imaginary RCT described earlier. In this situation, we do not reject the null hypothesis, based on the 5% threshold. So, can we conclude that the drug is no different from placebo? Certainly not, and we definitely cannot conclude that the drug is similar to placebo, either. After all, we did find that there was a definite difference in the response rate between drug and placebo; it is just that this difference did not meet our arbitrary cut-off for statistical significance…

Consequently, it should be considered fallacious to insert an arbitrary threshold to define results as significant or nonsignificant, as though significant versus nonsignificant results are in some ways categorically different the way people who are dead versus alive are categorically different… In fact, declaring significance may give us a false sense of confidence that a finding exists in the population, while rejecting significance may give us a false sense of confidence that the finding does not exist.”

Det interessante sker dog, når mange studier rapporterer en positiv effekt selvom de hver for sig måtte være insignifikante. For hvis HCQ rent faktisk ikke virkede så burde vi se en nogenlunde lige distribution mellem positive og negative resultater — for nogle gange er tilfældighederne på HCQ’s side og andre gange er de ikke.

Før kiggede vi på resultaterne fra de 20 RCT’s, hvor størstedelen viste en positiv effekt selvom de ofte var insignifikante (og dermed fortolkedes som HCQ=SOC fordi p-værdien>0,05). Når vi kigger på alle studier, er der følgende billede:

Figur 6. Billedet henter her den 28. oktober

90 ud af 121 studier viste en positiv effekt målt på den vigtigste resultatvariabel. Chancen for at et virkningsløst middel kunne få 90 ud af 121 til at vise en positiv virkning svarer til at vende en mønt (fordi der er lige sandsynlighed for et negativt/positivt resultat) 121 gange og få plat mindst 90 gange. Sandsynligheden er 1 ud 26 millioner (0,0000000374) som vist i nedestående billede:

Figur 7 (Geogebras sandsynlighedslommeregner)

Den skarpe læser vil påpege at studier ofte har flere forskellige resultatvariable. Antag at alle studier har 2 variable og forfatterne bag figur 6 valgte den positive hver gang det var muligt. Det svarer til at slå terningen dobbelt så mange gange. Og så er sandsynligheden for at slå plat (positive udfald) over 90 gange ligmed 99,99%. Denne lille detalje skaber altså et diametralt modsat billede. Derfor har forfatterne bag analysen sørget for at være konsekvent om vælge den “vigtigste” variabel for hvert studie. Altså er dødelighed kommet over hospitaliseringer — og hospitaliseringer over indlæggelsestid osv.

RCT’s er upraktiske og dyre af natur og dette begrænser dem ofte til en lille population. Med en mindre stikprøve stiger den statistiske sandsynlighed for, at udsving skyldes tilfældigheder. Dette stiller store krav til interventionens effektivitet for at kunne opnå en p-værdi under 5%. F.eks. skulle den i Mitja et al.’s tilfælde være 72% eller over. Derfor er metaanalyser belejlige i det de statistisk sammenfatter data fra flere forskellige studier og på den måde får ”populationen” til at stige, hvilket muliggør at moderate virkninger kan blive statistisk signifikante.

En metaanalyse fra den 30. september sammenlagde resultaterne fra de RCT’s der analyserede HCQ’s effektivitet som post exposure profylaksis (PEP). Det er Mitja et al. (16. juli), Skipper et al., Mitja et al. (26. juli), Rajasingham et al. og Boulware et al.. Selvom de alle hver for sig havde en negativ fortolkning viste sammenfatningen en signifikant forbedring på 25% med HCQ.

Altså kan man spørge: Skyldes den manglende statistiske signifikans at HCQ ikke er effektivt eller at populationen i studierne ikke var store nok? Dette spørgsmål er forsøgt belyst af 42 matematikere, statistikere og læger, som har lavet følgende tabel, hvor de sammenligner resultaterne for dexamethason i RECOVERY-studiet sammen med resultaterne for HCQ i Boulware, Skipper og Mitja et al.:

Fra: “Concerns regarding the misinterpretation of statistical hypothesis testing in clinical trials for covid-19

Her kan det ses at den målte effekt faktisk var mindre i RECOVERY-studiet, men på grund af en større population blev der opnået statistisk signifikans. I kolonne 6 udregnede de den hypotetiske p-værdi for HCQ-studierne hvis de fremskrev den målte tendens til en population på størrelse med RECOVERY’s. Således ville Boulware og Skipper et al. opnå en lavere p-værdi end RECOVERY mens Mitja et al. ville ligge på grænsen til signifikans. Resultaterne af dexamethason i RECOVERY blev hyldet og straks brugt i hele verden, mens resultaterne i Boulware, Skipper og Mitja et al. blev brugt til at argumentere imod HCQ — selvom der er en overvejende sandsynlighed for at insignifikansen skyldtes små populationer.

I Eric Strong’s (Stanford University) introduktion til evidensbaseret medicin gør han det klart, at mange læger tror evidens handler om “just being able to recite the abstracts and conclusions of the most important studies in the field”. Måske spiller det en rolle i modstanden mod HCQ at der lægges for meget vægt på forfatternes enkeltvise, egne fortolkninger?

RECOVERY og SOLIDARITY: Fundamentale metodiske problemer

Selvom mange af de publiserede RCT’s målte en positiv effekt via HCQ, er det ikke tilfældet for de velsagtens to vigtigste studier på coronabehandlingsområdet: RECOVERY og SOLIDARITY.

RECOVERY trial var en landsdækkende engelsk RCT foretaget i foråret af forskere fra Oxford University. Her gav man 1561 hospitaliserede patienter HCQ og sammenlignede dem med 3155 patienter der fik “standard of care” (SOC). SOLIDARITY trial var en multinational RCT koordineret af WHO hvor man gav 954 hospitaliserede patienter HCQ og sammenlignede dem med en kontrol på 4088. Altså er der tale om meget store RCT’s.

RECOVERY viste en HCQ-dødelighed der var 9% højere end kontrolgruppens (p=0,15), mens SOLIDARITY viste en dødelighed der var 19% højere (p=0,23).

Resultaterne fra disse to fylder rigtig meget i vestens afvisning af HCQ. RECOVERY er det første studie i NIH’s systemiske gennemgang og den fylder 98% i Australiens Covid-taskforce’s metaanalyse af dødeligheden med HCQ (selvom der indgik 7 andre studier).

Der er bare to store metodiske problemer i studierne, som åbenbart bliver negligeret:

Doseringsmængden af HCQ: Toksisk

Her er RECOVERY’s doseringprotokol med HCQ samt SOLIDARITY’s nedenunder:

Begge studier fulgte altså samme protokol og lidt hurtig regning fortæller os at patienterne over 10 dage modtog 9,6 gram HCQ. De fik 2,4 gram de første 24 timer (loading dose). Dette er meget mere end hvad man har brugt i andre studier. Baseret på et nyligt peer reviewed studie er den optimale dosis 4,1 g fordelt over 10 dage med en “high initial dose of 1,3 g”.

Studierne brugte altså næsten en dobbelt så stor loading dose som anbefalet (og den anbefalede er i forvejen høj). Over 10 dage var doseringen næsten 2,5x højere end den anbefalede. Det vel bare mere af det gode?

Nej. En brasiliansk RCT fra april viste at en dosis på 12 g over 10 dage (kun 25% mere end end i RECOVERY og SOLIDARITY) øgede dødeligheden betydeligt (OR 2,8) sammenlignet med en lav-dosis protokol. De brasilianske forskere er blevet anklaget for uagtsomt manddrab på 11 patienter der døde direkte af en overdosis.

I slutningen af maj skrev Indian Council of Medical Research (ICMR) til WHO, at de var bekymrede over de anvendte HCQ-doser i SOLIDARITY, som var fire gange højere end i Indien, hvor der er en udbredt og koordineret brug af medikamentet mod covid-19.

For klorokin (moder-molekylet) er den dødbringende enkeltdosis estimeret til 20mg/kg hvilket svarer til 1,5 gram for et 75kg tungt menneske. For HCQ, der er mindre toksisk, estimeres den til være fra omkring 3–5 gram (4g for et 75kg tungt menneske). De 2,4 gram der blev brugt indenfor de første 24 timer er altså ikke langt fra en potentielt dødbringende enkeltdosis på 3 gram.

Det er altså meget fouroligende at der blev brugt toksiske doser som utvivlsomt har medvirket til den højere dødelighed. Meget tyder på at doseringsmængden blev forvirret med dén brugt til hydroxyquinolin mod dysenteri.

Af uransagelige årsager er doseringsmængden ikke medtaget i NIH’s vurdering af RECOVERY’s begrænsninger:

Covid-19 Treatment Guidelines

For sen intervention

Hydroxyklorokin skal bruges ambulant mod covid-19. Det vil sige, at det er mere effektivt jo hurtigere det bliver brugt fra symptomstart. Hvorfor?

“Treating covid-19 is very phase specific and this is missed by many so called experts”

Sådan lyder det fra Paul Marik, professor i medicin i Eastern Virginia Medical School, som står bag MATH+ protokollen til behandling af covid-19 i hospitaler. HCQ er hovedsageligt et antiviral (selvom det også virker immundæmpende og derfor kan have en effekt mod den såkaldte cytokinstorm) hvorfor det — ifølge alle dets fortalere - bør bruges mens den virale replikation er problemet. Og det er i starten.

Ovenstående billede illustrerer sygdomsforløbet for covid-inficerede. Her kan det ses hvordan virareplikationen og dermed koncentrationen er størst i starten af sygdommen hvor der er en infektion i de øvre luftveje. Når sygdommen senere udvikler sig til en nedre luftvejsinfektion er problemet ikke længere virareplikationen men derimod kroppens egen inflammation som bl.a. skaber vejrtrækningsbesværet.

Antivirale medikamenter er altså effektive før immunforsvaret selv får standset den virale replikation (og når den gør har den det med — specielt for ældre — at gøre mere skade end gavn). Det meget udbredte tamiflu (oseltamivir) der bruges som antiviral mod influenza virker eksempelvis kun indenfor de første 48 timer af symptomer og bliver hurtigt ineffektivt efter.

Hydroxyklorokin virker hovedsageligt ved at skabe en ionifor i kroppens celler for zink (hvorfor zink er et afgørende supplement til HCQ). HCQ skaber altså en passage gennem cellemembranen for zinkioner at komme ind. Zink har stærke antivirale egenskaber og er en vigtig del af immunsystemets virusrespons, men øget zinkindtag får ikke nødvendigvis zinkkoncentrationen i cellerne til at stige. Det kræver en zink-ionifor, hvor HCQ har vist sig at være den mest effektive:

Fra Bazarbachi et al.

Derudover fungerer HCQ også ved at øge den intracellulære pH-værdi en anelse, hvilket forstyrrer covid-19’s virareplikationen. En replikation der er størst lige omkring symptomstart og efter.

Når man snakker om HCQ’s effektivitet mod covid-19 er det altså afgørende at nuancere— på hvilket stadie? Alle 19 studier om tidlig brug af HCQ har rapporteret en positiv virkning:

Fra hcqmeta

Ovenstående metaanalyse af studierne om tidlig HCQ-brug konkluderer en meget signifikant 63% forbedring (RR 0,37, [0.29‑0.48]).

Alt i mens var patienterne i RECOVERY meget langt henne i sygdommen og meget syge. Dødeligheden var 27% i HCQ-gruppen og 25% i kontrolgruppen, hvilket er ekstremt højt (højere end italianske respiratorpatienters dødelighed på 23%). Alle var hospitaliserede og godt 60% modtog ikke-invasiv oxygen, mens 16,8% var i respirator. Mediantiden fra symptomstart til behandlingsstart var 9 dage:

Fra RECOVERY’s Supplementary Appendix

For SOLIDARITY er informationerne ikke ligeså detaljede, men der var stadig tale om patienter som var rigtig langt i sygdomsforløbet. Alle var hospitaliserede og 63% (602) fik enten oxygen eller respiratorhjælp:

Fra SOLIDARITY’s Supplemtary Material

For sen intervention med HCQ er dog ikke unikt for RECOVERY og SOLITARY. Det er tilfældet for 78 af alle 154 studier og 11 ud af de 20 RCT’s. At vurdere HCQ’s egenskaber ambulant på baggrund af sådanne studier er fejlagtigt.

Konklusion

Modstanden mod HCQ bygger altså i høj grad på at vurdere evidensen ud fra de 20 RCT’s selvom 121 studier er udgivet. 16 af de 20 RCT’s fortolkninger er rigtig nok negative men langt de fleste af dem viste faktisk en positiv effekt — omend insignifikant. Insignifikans er derimod ikke ensbetydning med ineffektivitet og kigger man på helheden af de udgivede studier fremfor enkeltvis er det uhyre usandsynligt at resultaterne skyldtes tilfældighed. De to vigtigste studier, RECOVERY og SOLIDARITY, der viste en negativ effekt af HCQ er præget af fundamentale metodiske problemer.

Bør behandlingen HCQ+zink indsættes ambulant i Danmark? Vurdér selv.

Således har resten af verden vurderet sagen

--

--

Kristian Francisco Milla Nielsen
Kristian Francisco Milla Nielsen

Written by Kristian Francisco Milla Nielsen

Interested in data, statistics, and evidence. 20 years old.

No responses yet