Nylige bestræbelser på at belyse den videnskabelige gyldighed af dyrebaserede lægemiddelforsøg fra medicinalindustrien, lobbygrupper for forsøg og dyrevelfærdsorganisationer

nov 20, 2021
admin

Responser på vores analyser af dyreforsøg med lægemidler/toksikologiske forsøg, og fortsat forsvar for dyreforsøg med lægemidler

Efter offentliggørelsen af hver af vores tre komplementære artikler i 2013, 2014 og 2015 skrev vi til snesevis af repræsentanter for lægemiddelvirksomheder, reguleringsmyndigheder og andre interessenter og bad om feedback i håb om at bygge videre på vores arbejde og åbne en dialog om dette vigtige spørgsmål med etiske konsekvenser for de dyr, der anvendes, og for de menneskelige brugere af lægemidler. Skuffende nok modtog vi kun få svar, og næsten alle svarene var formularagtige og høflige, men ikke engagerende. Association of the British Pharmaceutical Industry (ABPI) gav udtryk for visse betænkeligheder ved forskellige egenskaber ved det datasæt, vi anvendte, men vores omfattende, offentliggjorte svar udgjorde en fuldstændig tilbagevisning . Måske med forsinkelse annoncerede Det Forenede Kongeriges National Centre for the 3Rs (NC3Rs) – på trods af sin oprindeligt afvisende holdning – i sommeren 2016 sit eget samarbejdsprojekt med ABPI om at analysere industriens data Vi bifalder naturligvis dette, forudsat naturligvis, at det sker på en gennemsigtig og objektiv måde og helst med uafhængigt tilsyn. Dets med spænding ventede rapport var forventet i slutningen af 2018, men er stadig ikke blevet offentliggjort i skrivende stund.

I mellemtiden har nogle fortalere for dyreforsøg med lægemidler fortsat med at argumentere for, at disse forsøg har en nytteværdi, ved at citere nogle af de få, tidligere rapporter, der tyder på, at dette kan være tilfældet. Dette skal tages op, fordi denne konklusion ikke støttes af disse artikler. I en af disse rapporter blev der, som vi allerede har diskuteret i vores arbejde, ikke foretaget en vurdering af specificiteten, uden hvilken den bevismæssige vægt i forhold til sandsynligheden for toksicitet/ikke-toksicitet for mennesker, som dyremodellerne giver – og det er netop det, vi har brug for at vide – ikke kan beregnes. Som forfatterne af den citerede undersøgelse selv erkendte: “En mere fuldstændig evaluering af dette aspekt af forudsigelighed vil være en vigtig del af en fremtidig prospektiv undersøgelse.” En anden sådan citeret rapport viste, at forudsigeligheden hos mennesker for nogle terapeutiske områder var over 90 % – men den viste også mange andre områder, hvor resultaterne fra dyreforsøg ikke i væsentlig grad korrelerede med observationer hos mennesker, hvilket blev overset. Det er vigtigt, at denne analyse også anvendte Likelihood Ratios (LR’s), og forfatteren argumenterede for, hvorfor dette er bedre og nødvendigt – ligesom vi gjorde i vores egne artikler. Vores begrundelse for at anvende LR’er – som var på plads ved starten af vores analyser, før nogen data blev analyseret, og i lighed med ovennævnte undersøgelse – var ganske enkelt, at LR’er er langt mere hensigtsmæssige og inkluderende, idet de omfatter følsomhed og specificitet, som begge er nødvendige for at udlede den sande værdi af resultaterne af enhver test, og som er bedre end prædiktive værdier (PV’er), fordi de ikke afhænger af forekomsten af negative virkninger. Vi diskuterede dette i detaljer i vores artikler, og andre har specifikt støttet denne tilgang .

Andre, nyligt offentliggjorte analyser af toksikologiske lægemiddeldata

To undersøgelser, der ligner vores egen, er blevet offentliggjort i det seneste år. I betragtning af vores interesse i dette og i betragtning af spørgsmålets etiske og videnskabelige betydning ønsker vi at bidrage til diskussionen og debatten ved at fremhæve områder, som vi er enige i, og som vi bifalder, men også nogle problemer, som vi har med disse artikler og deres konklusioner.

Monticello et al.

En undersøgelse, der ikke er begrænset til, men som er baseret på PV’er, blev for ganske nylig offentliggjort af Monticello et al. i november 2017 . Selv om vi glæder os over og værdsætter forfatternes forsøg på at belyse dette kontroversielle og uigennemsigtige spørgsmål, mener vi, at deres konklusion om, at “Disse resultater støtter det nuværende regulatoriske paradigme for dyreforsøg til støtte for sikker indgang til kliniske forsøg og giver kontekst for nye alternative modeller”, skal tages op.

Der er efter vores mening flere vigtige forbehold. Måske er den mest fremtrædende, at – selv om forfatterne rapporterer både PV’er og LR’er – fokuserer de næsten udelukkende på Negative Predictive Value (NPV) for at understøtte deres konklusion. Dette er forvirrende i betragtning af arten af disse statistiske målinger og deres tilhørende kvaliteter og mangler, og især i betragtning af, at forfatterne specifikt diskuterer nogle af dem, før de i sidste ende overser dem. For eksempel, selv om de indrømmer, at LRs “ikke er påvirket af klinisk positiv prævalens” (hvilket er grunden til, hævder nogle, at de kan være overlegne), forhindrer dette ikke forfatterne i at fortsætte med at koncentrere sig om PVs, som er påvirket af toksicitetsprævalens.

Vi har i vores analyser argumenteret ret detaljeret for, hvorfor LRs bør anvendes frem for PVs , som nævnt ovenfor. Der er rigelig st øt t e for dette i lit t erat uren. Kort sagt hævder eksperter, at LR’er er det “optimale valg”, er “mere informative end PV’er” og er “den enkeltstående mest kraftfulde indikator for diagnostisk anvendelighed”, da de inkorporerer sensitivitet og specificitet og er uafhængige af prævalens, som skal tages i betragtning for at estimere værdien af en test (se ).

Monticello et al.’s vægt på en høj NPV accepteres at være “…i høj grad baseret på den lave klinisk positive prævalens, der er observeret i vores database og i litteraturen, hvilket kan tilskrives det faktum, at forbindelser, der går ind i den kliniske udvikling, typisk har klaret mange sikkerhedshürder via omfattende in silico-, in vitro- og in vivo-screening af lead-optimeringsaktiviteter.” Alligevel ser det ud til, at forfatterne overser bidraget fra disse screeningsaktiviteter, når de konkluderer, at det ikke er dem, men den manglende toksicitet i dyreforsøg, der forudsiger en manglende toksicitet klinisk, i en sådan grad, at de støtter det nuværende paradigme centreret om dyreforsøg. Det, der også udfordrer deres konklusion – selv hvis man tager forfatternes holdning og undgår LR’erne for at koncentrere sig om PV’erne – er, at deres beregnede positive PV’er (PPV’er) var relativt lave (et rapporteret gennemsnit på kun 36 %, selv når den lavt scorende kategori “andre organer” blev udelukket); forfatterne valgte at rapportere, at der var to imponerende værdier ud af de 36 rapporterede, for ikke-menneskelige primater (NHP’er), i kategorierne nervesystem og mave-tarmkanalen. Vi må stille spørgsmålstegn ved, hvordan dette kan “understøtte det nuværende regulatoriske paradigme for dyreforsøg”. Dyreforsøg er ikke kun påstået at eksistere for at “understøtte sikker adgang til kliniske forsøg” ved at forudsige, hvilke lægemidler der måske ikke er giftige for mennesker – de er også påstået at tjene som et effektivt middel til at opdage, hvilke lægemidler der kan være skadelige.

Når man undersøger LR’erne i Monticello et al.s analyse i stedet for PV’erne (se vores argument ovenfor), tegner der sig et mere klart billede. De rapporterede inverse negative LR’er (iNLR’er) er faktisk meget lave – nogle gange mindre end 1,0 og ofte knap nok større end enheden – hvilket tyder på, at dyreforsøgene ikke giver nogen bevismæssig vægt til sandsynligheden for, at et lægemiddel ikke vil vise nogen toksicitet hos mennesker. Dette er netop det fremtrædende resultat, som vi rapporterede om i vores artikler, og som underbygger vores argument om, at dyreforsøg ikke er egnede til formålet. De rapporterer en gennemsnitlig iNLR på kun 1,5-1,6 og en gennemsnitlig positiv LR (PLR) på 2,9. Det er lave LR-værdier, som indikerer, at dyreforsøgene giver meget lidt bevismæssig vægt til sandsynligheden for toksicitet/fravær af toksicitet for mennesker. De rapporterer også tilsvarende lave iNLR’er for gnavere, hunde og aber, som vi fandt. Kort sagt gentager og forstærker de faktisk på mange måder vores resultater i overensstemmelse med deres erklæring i afsnit 2.7 i deres metoder, at “Som en generel regel betragtes en test som “diagnostisk” ved forudsigelse af et positivt resultat, når LR+ er >10, eller ved forudsigelse af et negativt resultat, når iLR- er >10.” Af deres 36 mulige resultater opfyldte kun to PLR/LR+ den af forfatterne anerkendte “diagnostiske” definition af en værdi på > = 10, og ingen af iNLR’erne/iLR- gjorde det. Faktisk var 30 af iLR-værdierne < = 2, og de fleste af disse var på eller omkring enheden, dvs. de gav ingen bevismæssig vægt overhovedet. Med andre ord kan dyreforsøgene ifølge den definition og de kriterier, som de anfører, på baggrund af deres data og deres analyse ikke anses for at være diagnostiske/prædiktive.

Vi sætter pris på, at forfatterne anerkender nogle vigtige punkter om dette videnskabelige område generelt, samt nogle begrænsninger i deres undersøgelse. Som vi gjorde i vores eget arbejde, rapporterer de om “begrænsede” bestræbelser på at analysere værdien af dyreforsøg i fortiden og accepterer, at de er baseret på “historisk præcedens” og en antagelse om værdi. Med hensyn til deres analyse accepterer de, at deres data kun omfattede 182 lægemidler (sammenlignet med vores > 3200, f.eks.); de kiggede kun på overensstemmelse mellem dyreforsøg og fase I og omfattede ikke kliniske forsøg i senere faser, hvor flere lægemidler vil fejle. Deres undersøgelse anvendte også få, brede kategorier for bivirkninger ved lægemidler (ADR), hvilket begunstiger deres hypotese i forhold til flere og mere stringente klassifikationer; og de kombinerede mus og rotter som “én effektiv art”, selv om mus og rotter ofte viser betydelige forskelle i toksicitet . Endelig rapporterede de ingen interessekonflikter, men takkede næsten 20 biofarmaceutiske virksomheder i deres anerkendelser og har tilknytning til ni virksomheder. Selv om vi ikke antyder nogen uhensigtsmæssighed, kan nogle måske hævde, at de kunne have en interesse i at retfærdiggøre deres branche og virksomheders historiske og nuværende brug af dyr i lægemiddelforsøg.

Clark og Steger-Hartmann

Dette var en analyse af mere end 3000 lægemidler, baseret på data i Elseviers omfattende PharmaPendium-database . Forfatterne anvendte en tilgang, der ligner vores egen, ved at bruge LR’er til at bestemme den diagnostiske effekt af forsøg på dyr til at informere om human toksicitet, og konkluderede også, at deres undersøgelse bekræftede vores eget fremtrædende resultat: “…manglen på disse hændelser i ikke-kliniske undersøgelser viste sig ikke at være en god forudsigelse af sikkerheden hos mennesker, hvilket delvist bekræfter resultaterne af Bailey et al (2014). “.

Bekræftelse af vores fremtrædende fund er af største betydning af to årsager. For det første, selv om vi ikke søgte nogen validering af vores egen tilgang og publikationer, men altid har haft den største tillid til dem, var nogle interessenter med modsatrettede holdninger til værdien af dyrebaserede lægemiddelforsøg opsat på at nedgøre vores arbejde. For det andet er det, uanset hvor godt en dyretest kan forudsige toksicitet hos mennesker (hypotetisk), at det er fraværet af toksicitet hos dyr, der er den afgørende faktor for, at et nyt lægemiddel kan gå videre til kliniske (human) forsøg. Som vi fortsat hævder, betyder det, at hvis dyreforsøg fejler i denne afgørende henseende – hvilket de tilsyneladende gør – betyder det ikke blot, at disse forsøg ikke er egnede til deres overordnede formål (at identificere sikre og effektive lægemidler til mennesker), men det må også have konsekvenser for medicinalindustrien og dens tilsynsmyndigheder, og hvordan de generelt griber lægemiddelforsøg an.

Denne artikel bekræftede også vores anden hovedkonklusion, som antydede, at bivirkninger i dyreforsøg faktisk også er sandsynlige for at forekomme hos mennesker (om end, og det er vigtigt, ofte ikke på samme måde). Afgørende er imidlertid, at vi har fortolket konsekvenserne af dette aspekt anderledes. Både forfatterne til denne artikel og os selv fandt, at dette aspekt var meget varierende, uden noget klart mønster med hensyn til typer af toksiske virkninger eller typer af lægemidler. Vi konkluderede derfor, at dette ikke kan betragtes som særlig relevant eller pålideligt. Clark og Steger-Hartmann gav imidlertid nogle eksempler på, hvor dyrene forudsagde human toksicitet, men viste ikke, eller afvejede ikke disse mod områder, hvor dette forudsigelsesaspekt var lavere, ikke-eksisterende eller negativt. Faktisk lå nogle af de eksempler, som de gav, kun lige over den statistiske tærskel, som de selv havde fastsat. Derfor mener vi, at selv om både deres data og vores egne data støtter deres konklusion om, at “overførslen fra dyr til mennesker af mange vigtige observationer bekræftes som værende forudsigelig”, mener vi ikke, at de støtter deres konklusion om, at deres undersøgelse “…bekræftede den generelle forudsigelighed af dyresikkerhedsobservationer for mennesker”. Hertil kommer de meget dårligt forudsigelige observationer, som kun kan betragtes som alvorlige, såsom død, kramper, bevægelsesforstyrrelser og leverforstyrrelser.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.