FORSKNINGSSKANDALE: En amerikansk studie som påsto at nær 70 % av deprimerte pasienter ble symptomfrie etter å ha blitt behandlet av antidepressiva, viser seg å være falsk. Likevel lukker samfunnet øynene for de økonomiske bindingene både forskningen og mediene har til legemiddelindustrien. (Illustrasjonsfoto)

Den amerikanske psykiatrien har lyktes med å gjøre mainstream-mediene til sine tjenere, og i dette tilfellet har det ført så galt av sted at man kan snakke om en feil med episke dimensjoner.

Av Robert Whitaker – publisert på Mad in America 4. januar 2025.
Oversatt av forskningsredaksjonen i Mad in Norway, ved hjelp av Deepl.

Våren 2023 virket det endelig som at historien om STAR*D-skandalen, dvs. skandalen knyttet til den mest omfattende studien av antidepressiva-behandling – som Mad in America har rapportert om i 14 år – endelig ville tiltrekke seg mainstream-medienes oppmerksomhet. Alle ingrediensene til et medieoppslag med grensesprengende virkning var til stede, inkludert en erkjennelse fra innsiden av psykiatrien om at denne historien var av stor betydning for hele samfunnet.

Likevel har mediene forblitt tause, og nå er skandalen i ferd med å ebbe ut. Den amerikanske psykiatrien har manøvrert seg gjennom krisen. Den slipper å konfronteres med en offentlighet som nødvendigvis ville vært dypt sjokkert over å bli kjent med at den ofte siterte kumulative remisjonsraten på 67 %, i den «største og lengste studien som noensinne er gjort for å evaluere depresjonsbehandling», er et resultat av vitenskapelig uredelighet. I stedet for å avsløres for offentligheten vil de misvisende funnene nå bli stående som tilgjengelig informasjon og vil kunne siteres som evidens for antidepressivas effektivitet. 

Skandalen tjener som en historisk dom over etikken i amerikansk psykiatri, og i forlengelsen av dette også over NIMH (National Institute of Mental Health). Når det gjelder mainstream-mediene, er dette ytterligere en historie om hvordan de sviktet offentligheten og lot seg kue til taushet av en medisinsk disiplin som i flere tiår har brukt mediene til å fremme en fortelling som fremmer laugets interesser, men som er forkastet av laugets egen vitenskap.

Her er en oppsummering av skandalen, og skaden den har gjort.

Historien som ble fortalt til offentligheten

Da NIMH lanserte STAR*D-studien til en pris av 35 millioner dollar, lovet de at resultatene raskt ville bli formidlet og brukt som veiledning i klinisk behandling. Det var fra før velkjent at industrifinansierte studier av antidepressiva vanligvis brukte inklusjons- og eksklusjons-kriterier som valgte ut de pasientene som hadde størst sannsynlighet for å respondere godt på pillen, og at 60-90 % av pasientene i den virkelige verden dermed ikke kvalifiserte for slike studier. STAR*D-studien skulle gjennomføres på pasienter i den virkelige verden, og det var derfor den ville ha så stor betydning.

«Gitt mangelen på kontrollerte data (i reelle pasientgrupper), bør resultatene ha stor betydning for folkehelsen og for vitenskapelig signifikans, siden de er innhentet i representative deltakergrupper/-settinger ved hjelp av kliniske styringsverktøy som enkelt kan brukes i daglig praksis», skrev STAR*D-forskerne.

I STAR*D-studien fikk pasientene opptil fire forsøk på å finne et antidepressivt middel eller en kombinasjon av antidepressiva som fungerte. Hvis et første antidepressivt middel ikke hadde ført til remisjon (bedring) etter 12 uker, kunne et annet antidepressivt middel prøves i ytterligere 12 uker, og så videre, gjennom fire behandlingsnivåer. Hver gang en pasient viste seg å ha blitt frisk etter en av behandlingsperiodene, ble pasienten sluset inn i en ett år lang oppfølgingsstudie for å se om remisjonen kunne opprettholdes.

I 2006 publiserte American Journal of Psychiatry (AJP) fire rapporter om STAR*D. Tre av rapportene omhandlet remisjonsraten etter første og andre fase av studien, og i november samme år ble det publisert en oppsummering av resultatene fra studien. Sammendraget i oppsummeringsrapporten fortalte om en terapeutisk suksess:

«QIDS-SR16 hadde en remisjonsrate på 36,8 %, 30,6 %, 13,7 % og 13,0 % for henholdsvis det første, andre, tredje og fjerde akutte behandlingstrinnet. Den samlede kumulative remisjonsraten var 67 %.»

NIMH holdt sitt løfte om å spre studiens resultater raskt, og utbasunerte de gode nyhetene i en pressemelding. «I løpet av alle de fire nivåene ble nesten 70 prosent av dem som ikke trakk seg fra studien, symptomfrie.» Dette «nesten 70 %»-tallet var det viktigste resultatet av denne banebrytende studien, og i årene som fulgte, publiserte STAR*D-forskerne og andre ledende forskere i amerikansk psykiatri en rekke artikler som fremhevet den 67 % høye remisjonsraten, med grafikk som den nedenfor, som oppsummerte resultatene.

Kilde: Gaynes et al: Gaynes, et al. «Hva lærte vi av STAR*D? Resultater fra en storskala, praktisk, klinisk studie for pasienter med depresjon.» Psychiatric Services 60 (2009):1439-1445.

Den kliniske protokollen var klar: Hvis det første medikamentet ikke virker, prøv et annet, og hvis det andre ikke virker, prøv et tredje eller en kombinasjon av medikamenter, og hvis dette ikke virker, prøv igjen med et annet antidepressivt middel. Nesten 70 % av pasientene i den virkelige verden kunne forvente å bli «symptomfrie» med denne bruken av antidepressiva.

En grundig gjennomgang av studien 

Mens rapporten fra november 2006 fortalte om en terapeutisk suksess, kunne lesere som var kjent med STAR*D-artiklene som var publisert tidligere samme år, og som fortalte om resultatene fra det første og andre behandlingsnivået, se at noe var galt i denne kjeden av publikasjoner. Det mest bemerkelsesverdige var at det oppgitte antallet kvalifiserte pasienter hadde endret seg for hver publikasjon, fra 4 041 til 2 876. Forfatterne gikk også over fra å bruke HAM-D som hovedinstrument for å vurdere remisjoner i stadium én til et instrument kalt QIDS i november-artikkelen, uten noen forklaring på hvorfor de hadde gjort dette.

I sammendraget av november-rapporten ble det dessuten opplyst om en kumulativ remisjonsrate på 67 %, mens diskusjonsdelen av artikkelen avslørte at dette delvis var et konstruert tall. Forskerne hadde en hypotese om at hvis de som hadde droppet ut, hadde blitt værende i studien gjennom alle de fire behandlingsfasene, ville de ha opplevd bedring i like stor grad som de som ikke hadde droppet ut, og de la disse forestilte remisjonene til antallet pasienter som hadde kommet godt ut av det. Uten disse forestilte remisjonene ville den rapporterte remisjonsraten i artikkelen fra november 2006 ha ligget på rundt 50 %.

Det var ett annet rødt flagg. Artikkelen opplyste ikke om den vedvarende remisjonsraten ved slutten av den ettårige oppfølgingen. Hvor mange av dem som hadde opplevd bedring, hadde det fortsatt bra? Det eneste STAR*D-forskerne skrev, var at tilbakefallsraten i løpet av oppfølgingsperioden var høyere for dem som hadde brukt flere forsøk på å oppnå bedring. De publiserte riktignok en grafikk som skulle fortelle om overlevelsesraten for de 1518 pasientene som ble med i oppfølgingsstudien, men siden det ikke var noen diskusjon om hvordan grafikken skulle leses, var det umulig å finne mening i tallene.

Selv om disse faresignalene var til stede i artikkelen fra november 2006, ville det sannsynligvis ikke blitt gjort flere forsøk på å utfordre STAR*D-resultatene hvis det ikke hadde vært for det iherdige undersøkelsesarbeidet til psykologen Ed Pigott. Han så at noe ikke stemte, og etter at han hadde fått tak i en kopi av STAR*D-protokollen gjennom en FOI-forespørsel (Freedom of Information Act), kunne han og kollegene hans, med en første artikkel publisert i 2009, vise i detalj hvordan STAR*D-forskerne hadde avveket fra protokollen for å blåse opp de publiserte remisjonsratene.

I en artikkel fra 2010 tydeliggjorde Pigott og kollegene også innholdet i grafikken som viser ettårsresultatene. Av de 4041 pasientene som ble med i studien, var det bare 108 som hadde opplevd bedring og deretter holdt seg friske. På slutten av oppfølgingsåret fant man en dokumentert remisjonsrate på 3 %. De andre hadde enten aldri opplevd remisjon, de hadde opplevd remisjon og deretter tilbakefall, eller de hadde droppet ut av studien. Dette var et resultat som sto i sterk kontrast til den «kumulative remisjonsraten» på 67 % som ble proklamert for offentligheten som bevis på antidepressivenes effektivitet.

Mad in Americas gjennomgang av Pigotts artikkel fra 2010 hadde tittelen: «The STAR*D Scandal: A New Paper Sums It All Up.» I 2011 publiserte Pigott en artikkel med tittelen «STAR*D: A Tale and Trail of Bias» (En fortelling og spor av bias), som la fram protokollbruddene i detalj, og Mad in America publiserte dokumentene han hadde fått tilgang til gjennom sine FOI-forespørsler. Offentligheten hadde nå enkel tilgang til kildematerialet som fortalte hvordan STAR*D-forskerne hadde avveket fra protokollen for å oppnå den oppblåste remisjonsraten på 67 %.

Pigott og kollegene publiserte artikler om STAR*D-studien i 2015 og 2018, og hver gang publiserte Mad in America en review av artiklene. I boken Psychiatry Under the Influence fra 2015 skrev Lisa Cosgrove og jeg inngående om STAR*D-skandalen, som et eksempel på den «institusjonelle korrupsjonen» i psykiatrien som skyldes legemiddelindustriens interesser og psykiatriens egne laugsinteresser.

Men selv om Pigott og kollegene publiserte funnene sine i fagfellevurderte tidsskrifter, forholdt mainstream-mediene seg tause til denne kritikken av STAR*D-funnene. I stedet siterte medier, som The New Yorker, STAR*D-resultatene som evidens for effekten av antidepressiva. Så vidt jeg vet, var det eneste unntaket fra denne tausheten fra medienes side, rapporten om Pigotts artikkel fra 2010 i Medscape, en rapport som bekreftet at 3 % «stay-well-raten» var korrekt.

Selv om det fantes skribenter, som Bruce Levine, som skrev om STAR*D på online nettsteder som CounterPunch, forble mainstream-mediene tause. New York Times, Washington Post, Los Angeles Times, og så videre: Uansett om Pigotts dekonstruksjon av studien var velkjent for Mad in Americas lesere, fant den ikke veien til noen av de store avisene.

RIAT-reanalysen 

I 2019 fikk Pigott og hans kollega Jay Amsterdam, professor emeritus i psykiatri ved UPENN, tilgang til data på pasientnivå fra STAR*D-studien gjennom RIAT-initiativet (Restoring Invisible and Abandoned Trials). Dette initiativet ble etablert i 2013 for å gjøre det mulig for forskere å reanalysere datasett fra offentlig finansierte studier, særlig når det er grunn til å tro at de opprinnelige resultatene kan ha vært feilrapportert. De andre medlemmene av teamet var Thomas Kim, Colin Xu og Irving Kirsch.

En RIAT-reanalyse innebar at publikasjonene, basert på en korrigert analyse av datasettet, ville få et samfunnsmessig godkjenningsstempel. Pigott og kollegene kunne nå gå gjennom kasuistikkene for hver av de 4041 pasientene som var med i studien, og vurdere deres utvikling gjennom de ulike fasene: deres HAM-D-skårer ved baseline, om HAM-D-skårene viste at de var i remisjon ved slutten av en av behandlingsfasene, og om de eventuelt hadde droppet ut før de opplevde bedring. Prosjektets protokoll var laget for å kunne registrere disse prosessene gjennom de ulike fasene og det var dermed mulig å følge de enkelte forløpene. 

STAR*D-forskerne hadde i sin rapport fra november 2006 oppgitt at 67 % av pasientene hadde opplevd bedring etter å ha gått gjennom de fire behandlingsnivåene (2460/3671). I en artikkel publisert i BMJ Open i august 2023 viste Pigott og kolleger at hvis protokollen hadde blitt fulgt, ville 1089 av 3110 pasienter (35 %) ha blitt rapportert som friske eller i bedring (having remitted) etter å ha gått gjennom de fire behandlingsfasene.

Med tilgang til data på pasientnivå kunne Pigott og kollegene videre redegjøre konkret for tre brudd på protokollen og hvordan feilene som dermed oppsto ble brukt av STAR*D-forskerne til å blåse opp remisjonsraten.

  1. 607 pasienter som ble innrullert i studien, var ikke deprimerte nok til å være kvalifisert for studien (studien krevde en baseline HAM-D-skår på 14 eller høyere). Ytterligere 324 manglet en baseline-skår. I sin første rapport om remisjoner etter første behandlingsfase hadde STAR*D-forskerne med rette bemerket at disse 931 pasientene ikke oppfylte kriteriene for å delta i studien, og at de dermed ikke var «evaluerbare» pasienter. STAR*D-forskerne lurte imidlertid denne gruppen på 931 pasienter inn igjen i tellingen av remisjoner da de rapporterte resultatene på nivå to, og de fortsatte å inkludere denne gruppen som «evaluerbare» pasienter da de publiserte den kumulative remisjonsraten i november 2006. Dette økte antallet remitterte pasienter med 570.
  1. I protokollen sto det at HAM-D skulle brukes til å vurdere bedring. Ved besøk i klinikker fikk klinikerne også i oppdrag å gjøre registreringer ved et såkalt «ublindet verktøy» (det vil si at administratorene og deltakerne kjente til hvem som fikk/hadde fått hvilken behandling), kalt Quick Inventory of Depressive Symptomatology (QIDS), for å vurdere hvordan det gikk med pasientene. Siden studien var ment å forholde seg til behandling i den virkelige verden, skulle dette instrumentet brukes til å vurdere om dosene burde endres og om andre medikamenter – for eksempel sovemedisiner – burde forskrives. I protokollen ble det eksplisitt slått fast at «forskningsresultater ikke samles inn på klinikken», og at QIDS derfor ikke ville bli brukt som et resultatinstrument. I rapporten fra november 2006 brukte imidlertid STAR*D-forskerne QIDS-skårene til å rapportere remisjonsrater, uten å nevne HAM-D-poengsummene. Denne overgangen til et ublindet instrument, et instrument som ikke skulle brukes til å rapportere forskningsresultater, førte til at antallet remitterte pasienter økte med 195.
  1. Selv om studieprotokollen ikke sa noe om hvordan frafall skulle telles, ble det i en artikkel fra STAR-D-forskerne i 2004 hevdet at pasienter med manglende HAM-D-skårer ved slutten av hvert behandlingstrinn ble «antatt å ikke ha remisjon», noe som betyr at de skulle regnes som mislykket behandling. Dette premisset ble brutt og i stedet opererte STAR*D-forskerne, som nevnt ovenfor, med en teori om at hvis de som droppet ut av studien, hadde blitt værende i studien gjennom alle de fire behandlingsnivåene, ville de ha opplevd bedring i samme grad som de som ble værende i studien. Dette tankeeksperimentet, som forvandlet de som droppet ut til remitterte, økte antallet remitterte pasienter med ytterligere 606.

Med disse tre protokollbruddene (og ett mindre brudd) endret STAR*D-forskerne remisjonsligningen fra 1 089/3 110 (35 %) til 2 460/3 671, dvs. en remisjonsrate på 67 %. Bruddene på protokollen førte til at 1 371 personer ble feilaktig registrert som remittert, noe som betyr at 56 % av remisjonene skyldtes disse bruddene.

Mediene forble tause

I september 2023 publiserte MIA en lang rapport med tittelen «The STAR*D Scandal: Vitenskapelig uredelighet i stor skala». Vi iverksatte også en underskriftskampanje på change.org med krav om at AJP (American Journal of Psychiatry) skulle trekke tilbake artikkelen fra 2006. Selv om AJPs sjefredaktør Ned Kalin ignorerte oppropet vårt, som var undertegnet av mer enn 2000 personer, så det ut til å ha truffet en nerve, og i desember publiserte AJP en kommentar av John Rush, hovedansvarlig for STAR*D-studien, og fire av hans kolleger, der de forsøkte å forsvare troverdigheten til artikkelen fra november 2006.

Deres svar til Pigott og kollegene var arrogant i tonen og avslørte en total mangel på respekt for sannheten.

Det mest graverende bruddet som Pigott og kollegene hadde identifisert, var at STAR*D-forskerne hadde telt med remisjoner i gruppen på 931 pasienter som manglet en HAM-D-skår ved baseline, eller som ikke var deprimerte nok, basert på HAM-D-skåren, til å kvalifisere for studien. Som STAR*D-forskerne erkjente i sin rapport fra første fase, var denne gruppen ikke «evaluerbare» pasienter. Likevel, i sin kommentar med tittelen «The STAR*D Data Remain Strong: Reply to Pigott et al.», anklaget STAR*D-forskerne Pigott og kollegene for å ha brukt ‘post-hoc-kriterier’ for urettmessig å fjerne disse pasientene fra reanalysen av remisjoner.

De skrev følgende:

Og videre:

Og så:

Ved å publisere denne kommentaren hadde nå også AJP knyttet sitt navn til skandalen. Pigott og kollegene hadde spesifikt beregnet resultatene i tråd med protokollen – det var hele poenget med deres RIAT-reanalyse. Dermed publiserte AJP nå en beskyldning som åpenbart var falsk. Rush og kollegene, sammen med AJP, regnet tydeligvis med at AJPs lesere ikke var nysgjerrige nok til å bry seg om å lese Pigott-artikkelen, eller – om de gjorde det, hadde de så sterke føringer på å avvise kritikk av egen profesjon at de bare ville forutsette at STAR*D-forfatterne – sentrale opinionsledere på depresjonsfeltet – nødvendigvis fortalte sannheten.

Samtidig var det åpenbart for dem som hadde lest Pigott og kollegaenes artikkel og hadde forstått den RIAT-definerte metodikken, at STAR*D-forskerne neppe kunne gi en ærlig forklaring i sitt forsvar av troverdigheten til artikkelen fra november 2006. I stedet hadde de funnet på denne «post hoc»-beskyldningen i et forsøk på å svekke troverdigheten til Pigott og hans kolleger. Dette ser ut til å oppfylle de juridiske kriteriene for injurier, gitt at både STAR*D-forfatterne og AJP visste at Pigott og kollegene ikke hadde gjort det de ble beskyldt for.

Det faktum at Rush og kolleger publiserte brevet, var imidlertid et tegn på at skandalen var i ferd med å nå ut til offentligheten. Kort tid etter at deres kommentar sto på trykk i AJP, hadde Psychiatric Times et hovedoppslag om Pigotts artikkel, med tittel: «STAR*D Detronisert?» og undertittel «Siden 2006 har STAR*D -studien skilt seg ut som et ikon i veiledningen av behandlingsbeslutninger rundt alvorlig depresjon. Men hva om det er noe fundamentalt galt med den?» Dette var øyeblikket da man trodde mediene ville bryte tausheten.

I essayet sitt beskrev redaktøren av Psychiatric Times, John Miller, på en ryddig måte hvilken innvirkning STAR*D hadde hatt på psykiatrien. «Hvis BMJ-forfatterne (Pigott et al. 2023) har rett, er dette et enormt tilbakeslag for oss i psykiatrien, ettersom alle publikasjoner og politiske beslutninger som er basert på STAR*D-funnene, og som har blitt kliniske dogmer etter 2006, må gjennomgås, revideres og muligens trekkes tilbake», skrev han.

Det var på dette tidspunktet at alle ingrediensene til en gjennombrudds-historie var på plass. Det var en erkjennelse fra psykiatriens egne rekker om at det hastet med å undersøke Pigotts re-analyse, og at dersom den holdt vann, ville det være åpenbart at forskrivere av antidepressiva, og hele det amerikanske samfunnet, hadde blitt alvorlig villedet av STAR*D-forskerne, med mye sosial skade som resultat.

Etter at Psychiatric Times hadde kommet på banen, sendte flere personer e-poster til redaktører i store aviser der de fortalte om denne skandalen under oppseiling og oppfordret dem innstendig om å dekke saken. Om mediene trengte enda flere grunner til å dekke saken, kom den i mars 2024, da psykiaterne Nicolas Badre og Jason Compton publiserte et brev i Psychiatric Times med tittelen «STAR*D: It’s Time to Atone and Retract» (Det er tid for å sone og trekke studien tilbake). De redegjorde i detalj for det etiske imperativet som psykiatrien nå sto overfor. De skrev:

Og:

Historien var linet opp for mediene, med dokumentene ryddet på plass på rekke og rad: Den opprinnelige rapporten fra 2006 med de røde flaggene som nå kunne identifiseres; Ed Pigotts iherdige jakt på «sannheten»; RIAT-reanalysen som ble publisert i et prestisjetungt tidsskrift, og som identifiserte bruddene på protokollen som STAR*D-forskerne hadde brukt for å blåse opp remisjonsraten på det groveste; brevet fra Rush og kollegene som forsvarte arbeidet deres, og som en lett kunne se at manglet troverdighet; og til slutt Psychiatric Times-historien som fortalte om den ekstraordinære innvirkningen STAR*-studien hadde hatt på forskrivningspraksis. Det ble presentert en liste over personer som kunne intervjues, og når det gjaldt å utdype skadevirkningene, kunne journalistene intervjue pasienter som hadde fått forskrevet antidepressiva siden 2006, og spørre dem: Ville de ha tatt en annen beslutning om bruken av antidepressiva hvis de hadde kjent til de sanne STAR*D-resultatene, inkludert at kun 3 % av pasientene forble friske etter ett år?

Men selv om redaktører i store aviser ble kontaktet, og Pigott og Amsterdam hadde kontakt med en journalist eller to, gikk månedene uten at det dukket opp noen artikler om STAR*D-skandalen i mainstream-mediene. Og for hver måned som gikk i taushet, bleknet muligheten for at allmennheten noen gang skulle få vite om skandalen.

I oktober i 2023 sendte Pigott og kollegene et brev til AJP-redaktør Ned Kalin, der de beskrev de «vitenskapelige feilene» i artikkelen fra november 2006, som fortalte om 67 % bedring, og krevde at artikkelen skulle trekkes tilbake. Ettersom kravet om tilbaketrekking kom fra forfatterne av reanalysen, ga det mediene enda en mulig knagg for å lage en nyhetssak.

Mad in America publiserte en kopi av forskernes tilbaketrekkingsbrev, men mediene forble tause. Kalin svarte ikke på brevet, og med tanke på at det har gått nesten 18 måneder siden Pigott og kollegene publiserte sin RIAT-reanalyse, ser det nå ut til at nyheten om denne skandalen aldri kommer til å bryte ut av Mad in Americas «ghetto», det vil si at selv om den er velkjent for våre lesere, vil den forbli ukjent for allmennheten.

Pigott, Amsterdam og kollegene fortsetter analysen av dataene på pasientnivå i STAR*D-studien, og ser på påstander som STAR*D-forskerne har fremsatt i andre artikler de har publisert. Det pågående arbeidet deres vil helt sikkert avdekke andre aspekter ved denne skandalen, for eksempel at STAR*D-forskerne unnlot å rapportere om alvorlige bivirkninger og selvmordstanker som følge av medikamenter. Det virker imidlertid usannsynlig at fremtidige rapporter også om slike funn vil vekke noen reaksjon fra mainstream-mediene når ikke en gang avsløringen av åpenbar vitenskapelig uredelighet i RIAT-reanalysen, gjorde det.

Det ser derfor ut til at den amerikanske psykiatrien kommer til å klare seg gjennom krisen og unngå å måtte svare for sin uredelighet overfor offentligheten. 

Den 10. desember 2024 kunne New York Times i en artikkel med tittelen «7 ting alle bør vite om antidepressiva» fortelle leserne nok en gang at «en stor studie av flere antidepressiva viste at halvparten av deltakerne hadde blitt bedre etter å ha brukt enten den første eller andre medisinen de prøvde, og nesten 70 prosent av personene hadde blitt symptomfrie etter det fjerde antidepressivet».

Dette var nyheten som The New York Times fant det passende å trykke:

En avgjørende utfordring for amerikansk psykiatri

Denne skandalen stilte den amerikanske psykiatrien, og dermed også NIMH, overfor en eksistensiell utfordring, en utfordring som kom til å definere deres forhold til samfunnet. Ville den amerikanske psykiatrien gjøre det eneste rette og undersøke om rapporten fra november 2006 om STAR*D-resultatene burde trekkes tilbake?

Det var alt John Miller og Psychiatric Times forlangte av American Journal of Psychiatry og psykiatrien som fagfelt. Lansere en offentlig etterforskning av saken og avgjøre om artikkelen bør trekkes tilbake.

Standardene for tilbaketrekking av en artikkel i et medisinsk tidsskrift er klare. I en artikkel fra 2011 om tilbaketrekking i et medisinsk tidsskrift, står det følgende:

«Artikler kan trekkes tilbake når funnene på grunn av vitenskapelig uredelighet eller feil ikke anses som troverdige, når de plagierer tidligere publisert arbeid, eller når de bryter med etiske retningslinjer. . . Selv om tilbaketrekkinger er relativt sjeldne, er tilbaketrekkingsprosessen viktig for å korrigere litteraturen og opprettholde tilliten til den vitenskapelige prosessen.»

Denne saken møtte standarden. Remisjonsraten på 67 % som ble publisert i AJP i november 2006, kunne på grunn av vitenskapelig uredelighet ikke lenger anses som troverdig. En tilbaketrekking av artikkelen var «avgjørende for å korrigere litteraturen og opprettholde tilliten til den vitenskapelige prosessen».

Videre er det slått fast i Verdensorganisasjonen for redaktører av medisinske tidsskrifter, i deres «Professional Code of Conduct» at «redaktører bør korrigere eller trekke tilbake publikasjoner når dette er nødvendig for å sikre den vitenskapelige dokumentasjonens integritet, og forfølge alle anklager om uredelighet knyttet til forskningen, vurderingen av artikkelen (reviewen) eller redaktøren inntil saken er løst».

Til slutt er det åpenbart at dette er en historie om forskningsfusk. Det er en åpenbar intensjon om å lure: Inkluderingen av 931 pasienter som ikke var kvalifisert for studien, når bedring ble beregnet, er ikke et eksempel på en ubevisst vitenskapelig feil, men snarere på at denne gruppen av ikke-kvalifiserte pasienter ble lurt inn i listen over evaluerbare pasienter for å blåse opp den kumulative remisjonsraten. Overgangen fra å bruke HAM-D til å vurdere remisjonsraten til QIDS-instrumentet, som ifølge protokollen eksplisitt ikke skulle brukes til å vurdere utfall, er et annet klart eksempel på en intensjon om å villede.

Det finnes tre hovedkategorier av uredelighet i forskning – fabrikkering, forfalskning og plagiat – og dette er et tilfelle av «forfalskning» av resultater, i motsetning til «fabrikkering» av data. Forfalskning defineres som «manipulering av forskningsmaterialer, -utstyr eller -prosesser, eller endring eller utelatelse av data eller resultater, slik at forskningen ikke er nøyaktig gjengitt i forskningsdokumentasjonen».

Brevet fra Badre og Compton, med tittelen «STAR*D: It’s Time to Atone and Retract» (det er tid for å sone og trekke tilbake), oppsummerte på best mulig måte den etiske utfordringen som RIAT-reanalysen innebar for amerikansk psykiatri. Nøkkelordet de brukte var «soning», som selvfølgelig har en betydning som stammer fra bibelske skrifter. I Bibelen er soning, som det står i en definisjon på nettet, «prosessen med å reparere relasjoner som har blitt ødelagt av ugjerninger». Det er et fremtredende konsept i både jødedommen og kristendommen, der det refererer til ideen om at mennesker må sone for sine synder mot Gud.»

I STAR*D sitt tilfelle kunne forfalskningen av resultatene ses på som en «synd» mot vitenskapens standarder, noe som svekket relasjonen mellom en medisinsk profesjon og det publikum den er ment å tjene. Badre og Compton hevdet at i mangel av en overbevisende forklaring fra STAR*D-forskerne på bruddene på protokollen, måtte fagfeltet, for å reparere sitt forhold til offentligheten, bekjenne forfalskningen av data og trekke studien tilbake slik at den ikke lenger smusset til evidensgrunnlaget for antidepressiva.

Det blir ingen soning

STAR*D-skandalen kan virke som et enkeltstående tilfelle av forfalskning, men den kan best beskrives som et særlig mørkt kapittel i en større historie om hvordan amerikansk psykiatri har sviktet sin plikt til å være en pålitelig formidler av vitenskapelige funn til den amerikanske offentligheten. Dette gjelder særlig i forbindelse med kommunikasjonen til offentligheten om depresjon og fordelene med antidepressiva.

Denne vedvarende svikten kan spores tilbake til publiseringen av DSM-III i 1980, da den amerikanske psykiatrien tok i bruk en «sykdomsmodell» for kategorisering og behandling av psykiske lidelser. På den tiden lanserte American Psychiatric Association (APA) en PR-kampanje for å selge denne nye modellen til offentligheten (en kampanje som i stor grad ble finansiert av legemiddelfirmaer). Publikum ble informert om at forskning hadde vist at psykiske lidelser var sykdommer i hjernen, og at det var grunn til å tro at de skyldtes kjemiske ubalanser. Vi ble fortalt at psykofarmaka rettet opp disse kjemiske ubalansene, som insulin virker mot diabetes.

Dette var en historie om et stort medisinsk fremskritt. Andregenerasjons SSRI-antidepressiva, fra og med introduksjonen av Prozac i 1988, ble hyllet som et gjennombrudd, og det samme ble andregenerasjons «atypiske» antipsykotika. I mellomtiden strømmet pengene fra legemiddelindustrien til APA for å fremme denne sykdomsmodellen, og de strømmet til akademiske psykiatere som fungerte som deres «nøkkel-opinionsledere» (KOLs).

Den amerikanske offentligheten organiserte sin tenkning og bruken av psykiatriske tjenester rundt denne fortellingen om et stort medisinsk fremskritt. Diagnostiseringen av depresjon og andre psykiske lidelser økte dramatisk, og det samme gjorde forskrivningen av psykofarmaka. Utgiftene til psykofarmaka i USA steg fra rundt 800 millioner dollar i 1987 til nesten 40 milliarder dollar 20 år senere.

Dette var den rådende offentlige beskrivelsen da STAR*D-studien ble iverksatt. I 2005, et år før STAR*D-rapportene ble publisert, offentliggjorde APA en pressemelding der de fortalte at en undersøkelse hadde vist at «75 prosent av forbrukerne tror at psykiske lidelser vanligvis skyldes en kjemisk ubalanse i hjernen». Dette, sa APAs president Steven Sharfstein, var bevis på «gode nyheter for [allmennhetens] forståelse av mental helse». En psykiater, heter det i pressemeldingen, er en «spesialist som er spesielt utdannet til å diagnostisere og behandle kjemiske ubalanser».

Samme år publiserte APA brosjyren «Let’s Talk Facts About Depression», som leverte det samme budskapet: «Antidepressiva kan forskrives for å korrigere ubalanser i nivåene av kjemikalier i hjernen.»

Men mens den amerikanske psykiatrien informerte offentligheten om antidepressiva og andre psykofarmaka, fortalte den vitenskapelige litteraturen en helt annen historie om fordelene ved «sykdomsmodellen» for behandling. Forskerne klarte nemlig ikke å finne bevis for at personer med alvorlige psykiske lidelser led av en kjemisk ubalanse. I stedet for å rette opp kjente kjemiske ubalanser, viste det seg at pillene førte til forstyrrelser i nevrotransmitter-funksjonen, og NIMH-studier fortalte om dårlige langtidsresultater.

Når det gjelder forskningen på antidepressiva, kunne et søk i den vitenskapelige litteraturen – litteratur publisert før 2006 – fortelle denne historien:

  • I 1984 rapporterte NIMH at en studie av deprimerte pasienter ikke hadde kunnet bevise at en lesjon i det serotonerge systemet var en primær årsak til depresjon. Dette var den første av mange slike fiaskoer, og i den tredje utgaven av APAs Textbook of Psychiatry, som ble utgitt i 1999, erkjente man dette faktum og skrev at flere tiår med forskning «ikke har bekreftet hypotesen om utarming av monoaminer» (serotonin er et monoamin). I 2005 skrev Kenneth Kendler, sjefredaktør for Psychological Medicine, at «Vi har jaktet på store, enkle nevrokjemiske forklaringer på psykiatriske lidelser uten å finne dem».
  • Før antidepressiva ble introdusert, trodde man at depresjon hadde et episodisk forløp. Epidemiologiske studier på 1980-tallet viste imidlertid at depresjon nå hadde et mer kronisk forløp, noe som fikk i hvert fall noen til å frykte at antidepressiva førte til en kronifisering av sykdommen. I 1994 skrev den italienske psykiateren Giovanni Fava: «Antidepressive legemidler mot depresjon kan være gunstige på kort sikt, men forverre sykdomsutviklingen på lang sikt ved å øke den biokjemiske sårbarheten for depresjon … . Bruk av antidepressiva kan føre til at sykdommen utvikler seg i en mer ondartet og behandlingsresistent retning.»
  • Etter hvert som samfunnet omfavnet bruken av SSRI-antidepressiva, økte uførheten som følge av affektive lidelser dramatisk. En av grunnene til dette var at SSRI-preparater viste seg å øke risikoen for at en person med unipolar depresjon skulle få en manisk episode og bli diagnostisert med bipolar lidelse, en diagnose med en mye dårligere prognose. En NIMH-studie fra 1995, som fulgte utviklingen hos deprimerte personer med og uten medisiner over en periode på seks år, viste at de som ble «behandlet» for sykdommen, hadde tre ganger så høy risiko som den ubehandlede gruppen for å miste sin «viktigste sosiale rolle» og nesten sju ganger så høy risiko for å bli «arbeidsuføre».
  • Før STAR*D-studien hadde NIMH finansiert to mindre studier som sammenlignet ettårsresultatene for medisinerte og umedisinerte pasienter i den «virkelige verden». I en studie av 118 polikliniske pasienter som fikk best mulig klinisk behandling, var det bare 26 % som responderte på antidepressiva i løpet av det første behandlingsåret (det vil si at symptomene ble redusert med minst 50 % på en vurderingsskala), og bare rundt halvparten av denne gruppen hadde en «vedvarende respons». Bare 6 % av pasientene opplevde at depresjonen forsvant helt i løpet av den ett år lange studien. I en studie av 84 pasienter med ikke-medisinerte depresjoner var 85 % av pasientene blitt friske etter ett år. Disse to NIMH-studiene ga resultater som var helt motsatte: 6 % bedring for dem som ble behandlet med antidepressiva, og 85 % bedring for dem som unngikk medisinene.

Denne vitenskapelige oversikten ga grunn til å forutsi at STAR*D-resultatene ville bli dårlige og bidra til bekymringen for at antidepressiva på lengre sikt økte sannsynligheten for at en medisinert depresjon ville få et kronisk forløp. Det var nettopp det RIATs reanalyse av dataene på pasientnivå viste: kun 35 % remisjon etter fire behandlingsnivåer, og bare en liten håndfull av de 4041 som deltok i studien, opplevde vedvarende remisjon etter ett år.

STAR*D-forskerne var imidlertid opptatt av fortellingen om at antidepressiva var en effektiv behandling. Det var dette narrativet deres profesjonslaug hadde fremmet, og de hadde også omfattende bånd til de farmasøytiske selskapene som solgte antidepressiva, og fungerte som deres KOLs (nøkkel-opinionsledere). De 12 STAR*D-forfatterne hadde til sammen 151 bånd til legemiddelfirmaer. Åtte av de 12 hadde bånd til Forest, produsenten av Celexa, studiemedisinen som ble gitt i den første fasen av studien.

I stedet for å rapportere funn som ville undergrave den offentlige fortellingen om fremgang, klarte STAR*D-forskerne å redde denne fortellingen, og ga den til og med et sterkere fundament ved å rapportere at nesten 70 % hadde blitt «symptomfrie» etter de fire fasene i prosjektet. Dernest skjulte de ettårsresultatene, og ga ingen informasjon om de alvorlige bivirkningene som pasientene måtte ha opplevd (selv om slik informasjon faktisk ble samlet inn i løpet av studien). Resultatet ble at den eneste «evidensbaserte» ytringen som kom ut av studien, var en remisjonsrate på «nesten 70 %».

Som Badre og Compton antydet i brevet sitt, tilbød RIAT-reanalysen psykiatrien en mulighet til å «sone» for sine tidligere synder, inkludert forfalskningen av resultatene i STAR*D-studien. Som de skrev, hadde psykiatrien «en etisk plikt overfor pasientene våre til å ta et ærlig blikk på resultatene fra forskningen vår når vi tar beslutninger som vil påvirke deres psykiske helse», og hvis AJP, APA og NIMH som svar på RIAT-reanalysen hadde satt i gang en etterforskning av denne saken og gjort denne kjent for offentligheten, ville det ha fungert som et bevis på at psykiatrien utviklet seg videre og oppfylte den «etiske plikten til å ta et ærlig blikk på bevisene fra forskningen vår» i tiden fremover.

Men å forvente at dette skulle skje, var som å plystre i vinden.

Vi kan nå se at amerikansk psykiatri har valgt å ikke gripe den muligheten, og i stedet har valgt å fortsette i samme retning som de siste 40 år; den prioriterer sine laugsinteresser fremfor sin «etiske plikt» overfor offentligheten. Dette valget kunne observeres i brevet som STAR*D-forskerne publiserte, der de feilaktig beskyldte Pigott og kollegene for å bruke «post-hoc-kriterier» for å redusere antallet kumulative remisjoner, og i det faktum at AJPs sjefredaktør Ned Kalin ikke engang tok seg bryet med å svare på brevet fra Pigott og Amsterdam, der de ba om at artikkelen fra november 2006 – og andre STAR*D-artikler – ble trukket tilbake.

Nå er det dette vi kan konkludere med: De forfalskede resultatene vil bli stående og det blir ingen soning for fagets synder.

Også mediene svikter oss 

Selv om det kan virke vanskelig å forstå medienes taushet, gitt den dokumentasjonen som forteller om STAR*D-skandalen, finnes det en historie som kan bidra til å forklare den. Medienes tilbakeholdenhet med å rapportere om resultater som truer laugets interesser, er ikke noe nytt, og den har sine røtter i en strategi som legemiddelindustrien og dens opinionsledere tok i bruk for mer enn 30 år siden.

Etter at den amerikanske psykiaterforeningen (APA) publiserte DSM-III, forsto de at de måtte kurtisere mediene for å få dem til å fremme sin sykdomsmodell. Det gjorde de på mange ulike måter, blant annet ved å arrangere «mediedager» for å fortelle om fremskrittene når det gjaldt å forstå biologien bak psykiske lidelser, og ved å dele ut priser til medier som publiserte historier om slike fremskritt. I 1988 lanserte Eli Lilly Prozac på markedet, og snart hyllet mediene medisinen som et gjennombrudd, og fortalte om hvordan den gjenopprettet en kjemisk ubalanse i hjernen. Pillen dukket til og med opp på populærmagasinenes forsider.

Men Eli Lilly – og dermed også den amerikanske psykiatrien – ble snart stilt overfor en PR-krise. I kliniske studier hadde Prozac vist seg å fremkalle selvmordstanker og voldelige tanker hos et betydelig antall pasienter, og i 1990 hadde så mange mennesker fått en negativ reaksjon på Prozac at en støttegruppe for Prozac-overlevende var blitt etablert. Mange som var blitt skadet av medisinen, hadde gått til advokat, og sommeren samme år var det særlig ett søksmål som fikk offentlighetens oppmerksomhet. Fem uker etter at han hadde begynt med Prozac, gikk Joseph Wesbecker inn på et trykkeri i Louisiana der han jobbet, og åpnet ild med et AK-47 automatgevær, drepte åtte og såret 12. Ofrene for skyteepisoden og deres familier saksøkte Eli Lilly, og plutselig var glansen rundt Prozac som en gjennombrudds-pille i fare.

Men så fikk Eli Lilly distraksjonen de trengte. Borgerkommisjonen for menneskerettigheter, som var tilknyttet Scientologien, sendte ut en pressemelding der de oppfordret Kongressen til å forby denne «drapsmedisinen», og Eli Lilly kastet seg raskt på, ettersom de nå hadde en metode for å diskreditere bekymringen rundt Prozac: «Disse søksmålene blir virvlet opp av scientologigruppen, som har en historie med å kritisere bruken av psykiatriske legemidler», het det.

Eli Lilly finpusset et firepunkts budskap til media: Dette var et problem som ble tatt opp av scientologer; omfattende kliniske studier hadde vist at Prozac var trygt og effektivt; selvmordshandlingene og drapene skyldtes sykdommen og ikke medisinen, folk som kunne ha blitt hjulpet, ble skremt bort fra behandling på grunn av denne kritikken, og dette var den virkelige trusselen mot offentligheten. Eli Lilly arrangerte medietrening for akademiske psykiaterne som de betalte for å være opinionsledere, og fikk dem til å øve praktisk på hvordan de skulle formidle dette budskapet.

Denne strategien betalte seg umiddelbart for Eli Lilly. En artikkel i Wall Street Journal informerte leserne om at scientologi var en «kvasireligiøs/forretnings-/paramilitær organisasjon» som «førte krig mot psykiatrien», og at den hadde angrepet Prozacs som en sikker medisin «selv om leger som ikke var tilknyttet Eli Lilly, under de kliniske forsøkene, hadde funnet ut at det var en lavere tendens til selvmordstanker med Prozac enn med andre antidepressiva, eller med narrepiller som ble gitt til en kontrollgruppe.»

Denne PR-strategien hadde vist seg bemerkelsesverdig vellykket, og den ble en modell som psykiatrien og dens opinionsleder kunne ta i bruk når de svarte på kritikk i media. Kritikerne ble identifisert som scientologer (eller de ble omtalt som folk som trodde jorda var flat, eller andre ting som delegitimerte kritikken deres), og ethvert medieorgan som publiserte kritikk, var uansvarlig, ettersom det kunne avskrekke folk fra å få hjelpsom behandling. Ansvarlige medier ville ifølge PR-strategien henvende seg til akademiske psykiatere som eksperter man kunne stole på når det gjaldt å informere publikum om fordelene ved psykofarmaka.

Opinionslederne – og den amerikanske psykiatrien – kunne forvente at dette argumentet ville beskytte deres laugsinteresser. Journalister som dekket «helse», kunne forventes å intervjue «ekspertene», og det innebar at de måtte henvende seg til akademiske psykiatere for sitater og forklaringer på forskningsfunn. Helsejournalistene og redaktørene deres i mainstream-mediene tok budskapet fra opinionslederne om at det var uansvarlig å rapportere saker som satte spørsmålstegn ved effekten av psykofarmaka til sitt hjerte, ettersom de da ville gi troverdighet til kritikere som var motivert av bias og en fiendtlig holdning til psykiatrien.

Kort sagt, for mer enn 30 år siden innførte legemiddelfirmaene og den amerikanske psykiatrien en PR-strategi for å delegitimere all kritikk av den fremskritts-fortellingen som de fortalte offentligheten. Dette var en strategi som lyktes med å skremme mainstream-mediene og som gjorde at de vegret seg for å gjøre sine egne undersøkelser av vitenskapslitteraturen.

Medias taushet om RIAT-reanalysen gjenspeiler denne institusjonelle vegringen. Forfatterne av STAR*D-studien er ekspertene som mainstream-mediene henvender seg til når de skal rapportere om effekten av psykofarmaka, og selv om Psychiatric Times åpnet for muligheten for at de store mediene ville rapportere om denne skandalen, er det nå åpenbart at selv denne åpningen ikke var nok til å overvinne den institusjonelle vegringen.

Eller for å si det på en annen måte: Den amerikanske psykiatrien har lyktes med å gjøre mainstream-mediene til sine tjenere, og i dette tilfellet har det ført så galt av sted at man kan snakke om en feil med episke dimensjoner.

Skaden 

Skaden som er påført den amerikanske offentligheten ved forfalskningen av STAR*D-resultatene kan formuleres slik: Samfunnet vårt har blitt nektet informert samtykke om fordelene ved de aktuelle antidepressivene, og hadde det ikke vært for forfalskningen av STAR*D-resultatene, ville den samfunnsmessige bruken av disse medikamentene sannsynligvis ha vært mye mer begrenset.

På individnivå gjorde de som valgte å ta antidepressiva etter at STAR*D-rapportene ble publisert, det med en forståelse av at forskningen hadde vist at to tredjedeler av de som tok pillene ble helt friske, uten symptomer. Mange kan fortelle om hvordan antidepressiva forbedret livene deres, men det er også tusenvis som forteller om hvordan disse medisinene har ødelagt livene deres.

De forteller om å bli maniske på SSRI-preparater og så diagnostiseres med bipolar lidelse, om seksuell dysfunksjon, om tardiv dysfori (en varig form for depresjon), om en smertefull form for uro som kalles akatisi, om forferdelige abstinenssymptomer når de prøver å trappe ned på antidepressiva, og om vedvarende skader på nervesystemet som fortsetter selv etter at de har sluttet å ta medisinene. Og disse pasientene, som det har gått dårlig med på antidepressiva, forteller jevnlig om hvordan de ble informert om at de hadde en kjemisk ubalanse, og fikk lite informasjon om de mulige risikoene ved langvarig bruk.

Historien om STAR*D-skandalen avslører at flere institusjoner har sviktet den amerikanske offentligheten. Gitt den betydningen STAR*D-studien har hatt for forskrivningen av antidepressiva, hadde American Journal of Psychiatry, American Psychiatric Association og NIMH alle en plikt til å gjøre RIAT-reanalysen kjent for offentligheten.

Det samme gjelder hele det amerikanske medisinske miljø. Flertallet av reseptene på antidepressiva skrives ut av allmennleger. BMJ Open er et allmennmedisinsk tidsskrift, og man kunne håpe at andre medisinske tidsskrifter i sine lederartikler ville ha kommentert Pigott-analysen og oppfordret til en undersøkelse av STAR*D-studien, gitt dens dyptgripende innvirkning på forskrivningspraksis. Det medisinske fagfeltet som helhet har en plikt til å beskytte evidensgrunnlaget sitt mot å bli tilsmusset av at resultater forfalskes, men så vidt jeg vet, har det ikke vært noe ramaskrik fra andre medisinske tidsskrifter om denne skandalen i den «største og lengste» studien av antidepressiva som noensinne er gjennomført.

Dette er konklusjonen man kan trekke av en gjennomgang av STAR*D-skandalen. Den amerikanske psykiatrien, NIMH, det øvrige medisinske miljøet og mainstream media … alle kan sies å ha forrådt den amerikanske offentligheten ved å unnlate å gjøre denne skandalen kjent.