Nyligen gjorda ansträngningar för att belysa den vetenskapliga giltigheten av djurbaserade läkemedelstester från läkemedelsindustrin, lobbygrupper som förespråkar tester och djurskyddsorganisationer

nov 20, 2021
admin

Svar på våra analyser av läkemedelstester/toxikologiska tester på djur, och fortsatt försvar av läkemedelstester på djur

Efter offentliggörandet av var och en av våra tre kompletterande artiklar 2013, 2014 och 2015 skrev vi till dussintals företrädare för läkemedelsföretag, tillsynsmyndigheter och andra intressenter för att be om återkoppling och på så sätt hoppas vi kunna bygga vidare på vårt arbete och inleda en viss dialog om denna viktiga fråga, med etiska implikationer för de djur som används och för de mänskliga läkemedelsanvändarna. Besviket nog fick vi bara ett fåtal svar, och nästan alla var formulerade och artiga, men inte engagerande. Association of the British Pharmaceutical Industry (ABPI) uttryckte vissa farhågor om olika egenskaper hos de data vi använde, men vårt omfattande, publicerade svar utgjorde ett fullständigt motargument. Kanske försenat tillkännagav Storbritanniens National Centre for the 3Rs (NC3Rs) – trots sin initialt avvisande hållning – sommaren 2016 sitt eget samarbetsprojekt med ABPI för att analysera industridata. Vi välkomnar naturligtvis detta, naturligtvis under förutsättning att det sker på ett öppet och objektivt sätt, och helst med oberoende tillsyn. Dess efterlängtade rapport förväntades i slutet av 2018, men har fortfarande inte tillkännagivits i skrivande stund.

Under tiden har vissa förespråkare av läkemedelstester på djur fortsatt att hävda att dessa tester är användbara, genom att citera några av de få, tidigare rapporter som antyder att så kan vara fallet. Detta måste tas upp, eftersom denna slutsats inte stöds av dessa artiklar. I en av dessa rapporter, som vi redan har diskuterat i vårt arbete, uppskattades inte specificiteten, utan att det inte går att beräkna djurmodellernas bevisvärde för sannolikheten för toxicitet/icke-toxicitet hos människor – vilket är precis vad vi behöver veta. Som författarna till den citerade studien själva erkände: ”En mer fullständig utvärdering av denna prediktivitetsaspekt kommer att vara en viktig del av en framtida prospektiv undersökning”. En annan sådan citerad rapport visade att förutsägbarheten hos människor för vissa terapeutiska områden var över 90 procent – men den visade också många andra områden där resultaten från djurstudier inte påtagligt korrelerade med observationer hos människor, vilket förbisågs. Det är viktigt att denna analys också använde Likelihood Ratios (LR), och författaren argumenterade för varför detta är överlägset och nödvändigt – precis som vi gjorde i våra egna artiklar. Vår motivering för att använda LR – som vi använde redan i början av våra analyser, innan några data analyserades, och i likhet med den tidigare nämnda studien – var helt enkelt att LR är mycket lämpligare och mer inkluderande och omfattar känslighet och specificitet, som båda är nödvändiga för att få fram det verkliga värdet av resultaten av ett test, och som är överlägsna Predictive Values (PV), eftersom de inte är beroende av förekomsten av negativa effekter. Vi diskuterade detta i detalj i våra artiklar, och andra har särskilt stött detta tillvägagångssätt .

Andra, nyligen publicerade analyser av läkemedelstoxikologiska data

Två studier som liknar vår egen har publicerats under det senaste året. Med tanke på vårt intresse för detta, och med tanke på frågans etiska och vetenskapliga betydelse, vill vi bidra till diskussionen och debatten genom att belysa områden som vi håller med om och som vi välkomnar, men också vissa problem som vi har med dessa artiklar och deras slutsatser.

Monticello et al.

En studie som inte begränsar sig till, men som förlitar sig på PVs, publicerades mycket nyligen av Monticello et al. i november 2017 . Även om vi välkomnar och uppskattar författarnas försök att belysa denna kontroversiella och ogenomskinliga fråga, anser vi att deras slutsats att ”These results support the current regulatory paradigm of animal testing in supporting safe entry to clinical trials and provide context for emerging alternate models”, måste tas upp.

Vi anser att det finns flera viktiga invändningar. Den kanske mest framträdande är att – även om författarna rapporterar både PVs och LRs – fokuserar de nästan uteslutande på Negative Predictive Value (NPV) för att stödja sin slutsats. Detta är förbryllande med tanke på karaktären hos dessa statistiska mått och deras tillhörande kvaliteter och brister, och särskilt med tanke på att författarna specifikt diskuterar några av dem innan de slutligen förbiser dem. Till exempel, även om de medger att LR ”inte påverkas av klinisk positiv prevalens” (vilket är anledningen till att de, enligt vissa, kan vara överlägsna), hindrar detta inte författarna från att fortsätta att koncentrera sig på PV, som påverkas av toxicitetsprevalensen.

Vi har i våra analyser argumenterat ganska detaljerat för varför LR bör användas i stället för PV , som nämnts ovan. Det finns gott stöd för detta i litteraturen. I korthet hävdar experterna att LR är det ”optimala valet”, att de är ”mer informativa än PV” och att de är ”den enskilt mest kraftfulla indikatorn på diagnostisk användbarhet”, eftersom de innehåller sensitivitet och specificitet och är oberoende av prevalens, som måste beaktas för att uppskatta värdet av ett test (se ).

Monticello et al.’s betoning på ett högt NPV accepteras vara ”…till stor del baserad på den låga kliniskt positiva prevalensen som observerats i vår databas och i litteraturen, vilket kan tillskrivas det faktum att föreningar som går in i den kliniska utvecklingen typiskt sett har klarat många säkerhetshinder via omfattande screeningaktiviteter för optimering av ledtrådar in silico, in vitro och in vivo”. Ändå verkar det som om författarna förbiser bidraget från dessa screeningaktiviteter, när de drar slutsatsen att det inte är de, utan bristen på toxicitet i djurförsök, som förutspår bristen på toxicitet kliniskt, till den grad att de stöder det nuvarande paradigmet som är centrerat på djurförsök. Det som också ifrågasätter deras slutsats – även om man antar författarnas ståndpunkt och undviker LR:s för att koncentrera sig på PV:s – är att deras beräknade positiva PV:s (PPV:s) var relativt låga (ett rapporterat medelvärde på bara 36 procent, även när den lågt värderade kategorin ”andra” organ uteslöts). Författarna valde att rapportera att det fanns två imponerande värden av de 36 rapporterade, för icke-mänskliga primater (NHP:s), i kategorierna nervsystem och mag-tarmkanalen. Vi måste fråga oss hur detta kan ”stödja det nuvarande regleringsparadigmet för djurförsök”. Djurförsök påstås inte bara existera för att ”stödja ett säkert inträde i kliniska prövningar” genom att förutsäga vilka läkemedel som kanske inte är giftiga för människor – de påstås också fungera som ett effektivt sätt att upptäcka vilka läkemedel som kan vara skadliga.

När man undersöker LR-värdena i Monticello et al:s analys i stället för PV-värdena (se vårt resonemang ovan), framträder en tydligare bild. De rapporterade inversa negativa LRs (iNLRs) är verkligen mycket låga – ibland mindre än 1,0 och ofta knappt större än ett – vilket tyder på att djurförsöken inte ger någon bevismässig tyngd åt sannolikheten att ett läkemedel inte kommer att visa någon toxicitet hos människor. Detta är just det framträdande resultat som vi rapporterade i våra artiklar och som underbygger vårt argument att djurförsöken inte är lämpade för sitt syfte. De rapporterar en genomsnittlig iNLR på endast 1,5-1,6 och en genomsnittlig positiv LR (PLR) på 2,9. Detta är låga LR-värden, vilket tyder på att djurförsöken ger mycket lite bevisvärde för sannolikheten för toxicitet eller avsaknad av toxicitet hos människor. De rapporterar också liknande låga iNLR-värden för gnagare, hundar och apor, vilket vi också fann. Kort sagt, på många sätt upprepar och förstärker de faktiskt våra resultat, i enlighet med deras uttalande i avsnitt 2.7 i deras metoder, att ”som en allmän regel betraktas ett test som ’diagnostiskt’ för att förutsäga ett positivt resultat när LR+ är >10 eller för att förutsäga ett negativt resultat när iLR- är >10”. Av deras 36 möjliga resultat uppfyllde endast två PLR/LR+ författarnas erkända ”diagnostiska” definition av ett värde > = 10, och ingen av iNLRs/iLR- gjorde det. Faktum är att 30 av iLR-värdena var < = 2, och de flesta av dessa låg på eller runt ett, vilket innebär att de inte gav någon evidensmässig tyngd alls. Med andra ord, enligt den definition och de kriterier som de anger, kan djurförsöken, baserat på deras data och deras analys, inte anses vara diagnostiska/förutsägande.

Vi uppskattar att författarna erkänner några viktiga punkter om detta vetenskapsområde i allmänhet, liksom vissa begränsningar i deras studie. Liksom vi gjorde i vårt eget arbete rapporterar de om ”begränsade” försök att analysera värdet av djurförsök i det förflutna, och accepterar att de bygger på ”historiskt företräde” och ett antagande om värde. När det gäller deras analys accepterar de att deras data endast omfattade 182 läkemedel (jämfört med våra > 3200, till exempel); de tittade endast på överensstämmelsen mellan djurförsök och fas I och inkluderade inte kliniska prövningar i senare faser, där fler läkemedel kommer att misslyckas. Deras studie använde också få, breda kategorier för biverkningar av läkemedel (ADR), vilket gynnar deras hypotes jämfört med fler och strängare klassificeringar, och de kombinerade möss och råttor som ”en effektiv art”, trots att möss och råttor ofta uppvisar betydande skillnader i toxicitet . Slutligen rapporterade de inga intressekonflikter, men tackade nästan 20 biofarmaceutiska företag i sina erkännanden, och har anknytning till nio företag. Även om vi inte antyder någon olämplighet kan vissa hävda att de skulle kunna ha ett intresse av att rättfärdiga sin industris och sina företags historiska och nuvarande användning av djur i läkemedelstester.

Clark och Steger-Hartmann

Detta var en analys av mer än 3 000 läkemedel, baserad på uppgifter i Elseviers omfattande PharmaPendium-databas . Författarna använde ett liknande tillvägagångssätt som vårt eget, genom att använda LRs för att fastställa den diagnostiska kraften hos tester på djur för att informera om toxicitet hos människor, samt att de drog slutsatsen att deras studie bekräftade vårt eget framträdande resultat: ”…avsaknaden av dessa händelser i icke-kliniska studier visade sig inte vara en bra prediktor för säkerhet hos människor, vilket delvis bekräftar resultaten från Bailey et al (2014). ”.

Bekräftelse av vårt framträdande resultat är av yttersta vikt av två skäl. För det första, även om vi inte sökte någon validering av vårt eget tillvägagångssätt och våra egna publikationer, utan alltid har haft största förtroende för dem, var vissa intressenter med motsatta åsikter om värdet av djurbaserade läkemedelstester fast beslutna att nedvärdera vårt arbete. För det andra, oavsett hur väl ett djurförsök kan förutsäga toxicitet hos människor (hypotetiskt), är det frånvaron av toxicitet hos djur som är den kritiska faktorn för att ett nytt läkemedel ska kunna gå vidare till kliniska prövningar (på människor). Som vi fortsätter att hävda, om djurförsök misslyckas i detta avgörande avseende – vilket de tycks göra – innebär detta inte bara att försöken inte är lämpade för sitt övergripande syfte (att identifiera säkra och effektiva humanläkemedel), utan detta måste också få återverkningar på läkemedelsindustrin och dess tillsynsmyndigheter, och hur de ser på läkemedelsförsök i allmänhet.

Denna artikel bekräftade också vår andra viktigaste slutsats, som tyder på att biverkningar i djurförsök i själva verket också är sannolika att uppträda hos människor (även om de, vilket är viktigt, ofta inte uppträder på ett liknande sätt). Avgörande är dock att vi har tolkat konsekvenserna av denna aspekt annorlunda. Både författarna till denna artikel och vi själva ansåg att denna aspekt var mycket varierande, utan något tydligt mönster när det gäller typer av toxiska effekter eller typer av läkemedel. Vi drog därför slutsatsen att detta inte kan anses vara särskilt relevant eller tillförlitligt. Clark och Steger-Hartmann gav dock några exempel på att djur faktiskt kunde förutsäga toxicitet hos människor, men visade inte, eller vägde inte dessa mot, områden där denna förutsägande aspekt var lägre, obefintlig eller negativ. Faktum är att några av de exempel som de gav bara låg strax över det statistiska tröskelvärde som de själva hade fastställt. Därför anser vi att även om både deras uppgifter och våra egna uppgifter stöder deras slutsats att ”Översättningen från djur till människa av många viktiga observationer bekräftas som prediktiv”, så stöder de inte deras slutsats att deras studie ”… bekräftade den allmänna prediktiviteten hos djurens säkerhetsobservationer för människor”. Detta förvärras av mycket dåligt förutsägbara observationer som endast kan betraktas som allvarliga, t.ex. dödsfall, kramper, rörelsestörningar och leverstörningar.

Lämna ett svar

Din e-postadress kommer inte publiceras.