Lääketeollisuuden, testauslobbausryhmien ja eläinsuojelujärjestöjen viimeaikaiset pyrkimykset selvittää eläimillä tehtyjen lääketestien tieteellistä pätevyyttä
Vastauksia eläimillä tehtyjä lääke-/toksikologisia testejä koskeviin analyyseihimme, ja eläimillä tehtävien lääkekokeiden jatkuva puolustaminen
Kolmen toisiaan täydentävän kirjoituksemme julkaisemisen jälkeen vuosina 2013, 2014 ja 2015 kirjoitimme kymmenille lääkeyhtiöiden edustajille, sääntelyviranomaisille ja muille sidosryhmille ja pyysimme palautetta ja toivoimme näin voivamme hyödyntää työtämme ja avata vuoropuhelua tästä tärkeästä aiheesta, jolla on eettisiä vaikutuksia sekä käytettäviin eläimiin että lääkkeiden ihmiskäyttäjiin. Pettymykseksi saimme vain niukasti vastauksia, ja lähes kaikki niistä olivat kaavamaisia ja kohteliaita, mutta eivät kiinnostavia. Ison-Britannian lääketeollisuuden yhdistys (Association of the British Pharmaceutical Industry, ABPI) esitti joitakin huolenaiheita käyttämämme aineiston eri ominaisuuksista, mutta merkittävä, julkaistu vastauksemme oli täydellinen vastine. Yhdistyneen kuningaskunnan kansallinen 3R-keskus (National Centre for the 3Rs, NC3R) ilmoitti kesällä 2016 ehkä myöhässä – huolimatta alun perin torjuvasta asenteestaan – omasta yhteistyöhankkeestaan ABPI:n kanssa teollisuuden tietojen analysoimiseksi. Pidämme tätä luonnollisesti myönteisenä edellyttäen tietenkin, että se tehdään avoimesti ja objektiivisesti ja mieluiten riippumattoman valvonnan alaisena. Sen odotettua raporttia odotettiin loppuvuodesta 2018, mutta sitä ei tätä kirjoitettaessa ole vieläkään julkistettu.
Sillä välin jotkut eläinkokeiden kannattajat ovat edelleen väittäneet, että näillä testeillä on hyötyä, vedoten joihinkin harvoihin aiempiin raportteihin, jotka viittaavat siihen, että näin saattaa olla. Tähän on puututtava, koska kyseiset julkaisut eivät tue tätä päätelmää. Kuten olemme jo käsitelleet työssämme, yhdessä näistä raporteista ei arvioitu spesifisyyttä, jota ilman ei voida laskea eläinmallien antamaa todistusvoimaa myrkyllisyyden tai myrkyttömyyden todennäköisyyden suhteen ihmiselle – mikä on juuri se, mitä meidän on tiedettävä. Kuten siteeratun tutkimuksen kirjoittajat itse myönsivät: ”Tämän ennustettavuusnäkökulman kattavampi arviointi on tärkeä osa tulevaa prospektiivista tutkimusta.” Toinen tällainen siteerattu raportti osoitti ihmisten ennustettavuuden olevan joillakin terapeuttisilla alueilla yli 90 prosenttia – mutta se osoitti myös monia muita alueita, joilla eläinkokeiden tulokset eivät korreloineet merkittävästi ihmishavaintojen kanssa, mikä jätettiin huomiotta. Tärkeää on, että tässä analyysissä käytettiin myös todennäköisyyssuhteita (Likelihood Ratios, LR), ja kirjoittaja perusteli, miksi tämä on parempi ja tarpeellisempi – aivan kuten me teimme omissa julkaisuissamme. Perustelumme LR:ien käytölle – jotka olivat käytössä analyysimme alussa, ennen kuin mitään tietoja analysoitiin, ja kuten edellä mainitussa tutkimuksessa – oli yksinkertaisesti se, että LR:t ovat paljon tarkoituksenmukaisempia ja kattavampia, koska ne sisältävät herkkyyden ja spesifisyyden, jotka molemmat ovat välttämättömiä minkä tahansa testin tulosten todellisen arvon määrittämiseksi, ja koska ne ovat parempia kuin ennustearvot, koska ne eivät riipu haitallisten vaikutusten esiintyvyydestä. Olemme käsitelleet tätä yksityiskohtaisesti julkaisuissamme, ja muut ovat erityisesti tukeneet tätä lähestymistapaa .
Muut hiljattain julkaistut analyysit lääkeaineiden toksikologisista tiedoista
Viime vuonna on julkaistu kaksi omaa tutkimustamme vastaavaa tutkimusta. Koska olemme kiinnostuneita tästä asiasta ja koska asia on eettisesti ja tieteellisesti tärkeä, haluamme osallistua keskusteluun ja väittelyyn tuomalla esiin osa-alueita, joista olemme samaa mieltä ja joihin suhtaudumme myönteisesti, mutta myös joitakin kysymyksiä, joita meillä on kyseisiin julkaisuihin ja niiden johtopäätöksiin liittyen.
Monticello ym.
Tutkimus, jota ei ole rajattu koskemaan vain PV:tä, mutta joka perustuu PV:hen, julkaistiin aivan hiljattain, marraskuussa 2017 , jonka tekivät Monticello ym . Vaikka suhtaudumme myönteisesti ja arvostamme kirjoittajien yrityksiä selvittää tätä kiistanalaista ja vaikeaselkoista kysymystä, katsomme, että heidän päätelmäänsä, jonka mukaan ”Nämä tulokset tukevat eläinkokeiden nykyistä sääntelyparadigmaa, joka tukee turvallista pääsyä kliinisiin tutkimuksiin, ja tarjoavat kontekstin kehitteillä oleville vaihtoehtoisille malleille”, on puututtava.
Katsomme, että on olemassa useita tärkeitä varoituksia. Ehkä merkittävin on se, että – vaikka kirjoittajat raportoivat sekä PV:t että LR:t – he keskittyvät johtopäätöksensä tueksi lähes yksinomaan negatiiviseen ennustearvoon (Negative Predictive Value, NPV). Tämä on hämmentävää, kun otetaan huomioon näiden tilastollisten mittareiden luonne ja niihin liittyvät ominaisuudet ja puutteet, ja erityisesti, kun otetaan huomioon, että kirjoittajat keskustelevat erityisesti joistakin niistä ennen kuin he lopulta jättävät ne huomiotta. Vaikka he esimerkiksi myöntävät, että LR-arvot ”eivät vaikuta kliinisen positiivisuuden esiintyvyyteen” (minkä vuoksi ne saattavat joidenkin mukaan olla parempia), tämä ei estä kirjoittajia keskittymästä PV-arvoihin, joihin toksisuuden esiintyvyys vaikuttaa.
Me perustelimme analyyseissämme jonkin verran yksityiskohtaisesti, miksi LR-arvoja olisi käytettävä mieluummin kuin PV-arvoja , kuten edellä mainittiin. Kirjallisuudessa on runsaasti tukea tälle. Lyhyesti sanottuna asiantuntijat väittävät, että LR-arvot ovat ”optimaalinen valinta”, ne ovat ”informatiivisempia kuin PV-arvot” ja ne ovat ”tehokkain yksittäinen diagnostisen hyödyllisyyden indikaattori”, koska ne sisältävät herkkyyden ja spesifisyyden ja ovat riippumattomia prevalenssista, joka on otettava huomioon testin arvon arvioimiseksi (ks. ).
Monticello et al.’n korkean NPV:n korostamisen hyväksytään ”…perustuvan suurelta osin tietokannassamme ja kirjallisuudessa havaittuun alhaiseen kliinisen positiivisen prevalenssiin, joka johtuu siitä, että kliiniseen kehitykseen tulevat yhdisteet ovat tyypillisesti läpäisseet monia turvallisuuteen liittyviä esteitä laajojen in silico-, in vitro- ja in vivo -johdon optimointiseulontatoimien kautta”. Vaikuttaa kuitenkin siltä, että kirjoittajat jättävät huomiotta näiden seulontatoimien osuuden, kun he päättelevät, etteivät ne, vaan myrkyllisyyden puuttuminen eläinkokeissa ennusta myrkyllisyyden puuttumista kliinisesti, siinä määrin, että he tukevat nykyistä eläinkokeisiin keskittyvää paradigmaa. Meidän on kysyttävä, miten tämä voi ”tukea eläinkokeiden nykyistä sääntelyparadigmaa”. Eläinkokeiden ei väitetä olevan olemassa vain ”tukemaan turvallista pääsyä kliinisiin tutkimuksiin” ennustamalla, mitkä lääkkeet eivät ehkä ole myrkyllisiä ihmisille – niiden väitetään myös toimivan tehokkaana keinona havaita, mitkä lääkkeet saattavat olla haitallisia.
Kun tarkastellaan Monticellon ym. analyysin LR-arvoja PV-arvojen sijasta (ks. väitteemme edellä), saadaan selkeämpi kuva. Raportoidut käänteisnegatiiviset LR:t (iNLR:t) ovat todellakin hyvin alhaisia – joskus alle 1,0 ja usein hädin tuskin yli ykkösen – mikä viittaa siihen, että eläinkokeet eivät anna mitään todistusvoimaa sille todennäköisyydelle, että lääkkeellä ei ole myrkyllisyyttä ihmisissä. Tämä on juuri se keskeinen havainto, josta raportoimme julkaisuissamme ja joka tukee väitettämme, jonka mukaan eläinkokeet eivät sovellu tarkoitukseensa. Niiden mukaan keskimääräinen iNLR on vain 1,5-1,6 ja keskimääräinen positiivinen LR (PLR) 2,9. Nämä ovat alhaisia LR-arvoja, jotka osoittavat, että eläinkokeet antavat hyvin vähän todistusvoimaa myrkyllisyyden todennäköisyydelle ihmiselle tai myrkyllisyyden puuttumiselle. Jyrsijöiden, koirien ja apinoiden iNLR-arvot ovat samankaltaisia alhaisia kuin me havaitsimme. Lyhyesti sanottuna, monella tapaa ne itse asiassa toistavat ja vahvistavat havaintojamme menetelmiensä kohdassa 2.7 esitetyn lausuman mukaisesti, jonka mukaan ”Yleissääntönä testiä pidetään ’diagnostisena’ positiivisen lopputuloksen ennustamisessa, kun LR+ on > 10, tai negatiivisen lopputuloksen ennustamisessa, kun iLR- on > 10”. Heidän 36 mahdollisesta tuloksesta vain kaksi PLR:ää/LR+ täytti kirjoittajien tunnustaman ”diagnostisen” määritelmän eli arvon > = 10, eikä yksikään iNLR:stä/iLR-:stä täyttänyt sitä. Itse asiassa 30 iLR-arvoista oli < = 2, ja suurin osa näistä arvoista oli yksikköä tai sen tuntumassa, eli niillä ei ollut lainkaan todistusvoimaa. Toisin sanoen heidän mainitsemansa määritelmän ja kriteerien mukaan eläinkokeita ei heidän tietojensa ja analyysinsä perusteella voida pitää diagnostisina/ennustavina.
Hyväksymme sitä, että kirjoittajat tunnustavat joitakin tärkeitä seikkoja tästä tieteenalasta yleisesti, samoin kuin heidän tutkimuksensa joitakin rajoituksia. Kuten mekin teimme omassa työssämme, he raportoivat ”rajallisista” pyrkimyksistä analysoida eläinkokeiden arvoa menneisyydessä ja hyväksyvät, että ne perustuvat ”historialliseen ennakkotapaukseen” ja oletukseen arvosta. Analyysin osalta he myöntävät, että heidän tietonsa koskivat vain 182 lääkettä (verrattuna esimerkiksi meidän > 3200 lääkkeeseen); he tarkastelivat vain eläinkokeiden ja vaiheen I vastaavuutta eivätkä ottaneet mukaan myöhemmän vaiheen kliinisiä tutkimuksia, joissa useammat lääkkeet epäonnistuvat. Heidän tutkimuksessaan käytettiin myös harvoja, laajoja luokkia lääkkeiden haittavaikutuksille, mikä suosii heidän hypoteesiaan verrattuna useampiin ja tiukempiin luokituksiin; ja he yhdistivät hiiret ja rotat ”yhdeksi tehokkaaksi lajiksi”, vaikka hiirillä ja rotilla on usein merkittäviä eroja toksisuudessa. Lopuksi he eivät ilmoittaneet eturistiriidoista, mutta kiittivät lähes 20 biolääkeyhtiötä kiitoksissaan, ja heillä on yhteyksiä yhdeksään yritykseen. Vaikka emme viittaa epäasiallisuuteen, jotkut saattavat väittää, että heillä voisi olla intressi perustella toimialansa ja yritystensä historiallista ja nykyistä eläinten käyttöä lääketestauksessa.
Clark ja Steger-Hartmann
Tämä oli yli 3000 lääkkeen analyysi, joka perustui Elsevierin kattavan PharmaPendium-tietokannan tietoihin . Kirjoittajat käyttivät samankaltaista lähestymistapaa kuin omamme käyttämällä LR-arvoja määrittääkseen eläimillä tehtyjen testien diagnostisen tehon, joka antaa tietoa ihmisiin kohdistuvasta myrkyllisyydestä, sekä päättelivät, että heidän tutkimuksensa vahvisti oman keskeisen havaintomme: ”…todettiin, että näiden tapahtumien puuttuminen ei-kliinisissä tutkimuksissa ei ole hyvä ennuste turvallisuudesta ihmisillä, mikä vahvistaa osittain Baileyn ja muiden (2014) havainnot. ”.
Keskeisen havaintomme vahvistaminen on äärimmäisen tärkeää kahdesta syystä. Ensinnäkin, vaikka emme hakeneet vahvistusta omalle lähestymistavallemme ja julkaisuillemme, vaan olemme aina luottaneet niihin täysin, eräät sidosryhmät, joilla oli vastakkaisia mielipiteitä eläimillä tehtävien lääkekokeiden arvosta, pyrkivät tarkoituksella mustamaalaamaan työtämme. Toiseksi, riippumatta siitä, kuinka hyvin eläinkokeet ennustavat (hypoteettisesti) myrkyllisyyttä ihmiselle, juuri myrkyllisyyden puuttuminen eläinkokeissa on ratkaiseva tekijä uuden lääkkeen etenemisessä kliinisiin (ihmisillä tehtäviin) tutkimuksiin. Kuten väitämme edelleen, jos eläinkokeet epäonnistuvat tässä ratkaisevassa suhteessa – kuten ne näyttävät epäonnistuvan – se ei tarkoita ainoastaan sitä, että kyseiset kokeet eivät sovellu yleiseen tarkoitukseensa (turvallisten ja tehokkaiden ihmisille tarkoitettujen lääkkeiden tunnistamiseen), vaan sillä on oltava vaikutuksia lääketeollisuuteen ja sen sääntelyviranomaisiin ja siihen, miten ne suhtautuvat lääketestaukseen yleensä.
Tämä artikkeli vahvisti myös toisen tärkeimmän havaintomme, jonka mukaan eläinkokeissa havaitut haittavaikutukset ilmenevät todennäköisesti myös ihmisillä (vaikkakaan ei useinkaan samanlaisella tavalla). Ratkaisevaa on kuitenkin se, että tulkitsimme tämän näkökohdan seuraukset eri tavalla. Sekä tämän asiakirjan kirjoittajat että me itse havaitsimme, että tämä näkökohta on hyvin vaihteleva, eikä siinä ole selkeää mallia myrkyllisten vaikutusten tai lääketyyppien suhteen. Siksi päädyimme siihen, että tätä ei voida pitää erityisen merkityksellisenä tai luotettavana. Clark ja Steger-Hartmann antoivat kuitenkin joitakin esimerkkejä tapauksista, joissa eläimet ennustivat myrkyllisyyttä ihmiselle, mutta eivät osoittaneet tai punninneet alueita, joilla tämä ennustava näkökohta oli vähäisempi, sitä ei ollut lainkaan tai se oli negatiivinen. Itse asiassa jotkin heidän antamistaan esimerkeistä olivat vain niukasti yli tilastollisen kynnysarvon, jonka he itse olivat asettaneet. Näin ollen katsomme, että vaikka sekä heidän tietonsa että omat tietomme tukevat heidän päätelmäänsä, jonka mukaan ”monien keskeisten havaintojen eläimistä ihmisiin siirtyminen on vahvistettu ennustettavaksi”, ne eivät tue heidän päätelmäänsä, jonka mukaan heidän tutkimuksensa ”…vahvisti eläimistä tehtyjen turvallisuushavaintojen yleisen ennustettavuuden ihmisiin”. Tätä pahentavat erittäin huonosti ennustavat havainnot, joita voidaan pitää vain vakavina, kuten kuolema, kouristukset, liikehäiriöt ja maksahäiriöt.