Recent efforts to elucidate the scientific validity of animal-based drug tests by the pharmaceutical industry, pro-testing lobby groups, and animal welfare organisations

nov 20, 2021
admin

Responsonses to our analyses of animal drug/toxicology tests, en verdere verdediging van dierproeven voor geneesmiddelen

Na de publicatie van elk van onze drie, complementaire papers in 2013, 2014 en 2015, hebben we tientallen vertegenwoordigers van farmaceutische bedrijven, regelgevende instanties en andere belanghebbenden aangeschreven met het verzoek om feedback, in de hoop voort te bouwen op ons werk en een dialoog te openen over deze belangrijke kwestie, met ethische implicaties voor de gebruikte dieren, evenals voor de menselijke gebruikers van geneesmiddelen. Teleurstellend is dat er maar weinig reacties zijn binnengekomen, en bijna allemaal waren ze formeel en beleefd, maar niet boeiend. De Association of the British Pharmaceutical Industry (ABPI) uitte enige bezorgdheid over verschillende kenmerken van de door ons gebruikte gegevensverzameling, maar ons substantiële, gepubliceerde antwoord vormde een volledige weerlegging. Wellicht laattijdig kondigde het Britse National Centre for the 3Rs (NC3Rs) in de zomer van 2016 – ondanks zijn aanvankelijk afwijzende houding – een eigen samenwerkingsproject met de ABPI aan om gegevens van de industrie te analyseren. Wij juichen dit natuurlijk toe, op voorwaarde natuurlijk dat het transparant en objectief gebeurt, en bij voorkeur met onafhankelijk toezicht. Het langverwachte rapport werd eind 2018 verwacht, maar is op het moment van schrijven nog steeds niet aangekondigd.

In de tussentijd zijn sommige voorstanders van dierproeven op geneesmiddelen blijven betogen dat deze proeven nut hebben, door enkele van de weinige, eerdere rapporten aan te halen die suggereren dat dit het geval zou kunnen zijn. Hierop moet worden ingegaan, omdat deze conclusie niet wordt ondersteund door deze rapporten. In een van deze rapporten werd, zoals wij reeds in ons werk hebben besproken, de specificiteit niet geraamd, zonder welke het bewijsgewicht ten aanzien van de waarschijnlijkheid van toxiciteit/niet-toxiciteit voor de mens, dat door de diermodellen wordt geleverd – en dat is nu juist wat wij moeten weten – niet kan worden berekend. Zoals de auteurs van de geciteerde studie zelf erkenden: “Een vollediger evaluatie van dit aspect van de voorspellende waarde zal een belangrijk onderdeel vormen van een toekomstig prospectief onderzoek”. Uit een ander geciteerd verslag bleek dat de voorspelbaarheid bij de mens voor sommige therapeutische gebieden meer dan 90% bedroeg – maar er waren ook veel andere gebieden waar de resultaten van dierproeven niet significant correleerden met de waarnemingen bij de mens, die over het hoofd werden gezien. Belangrijk is dat bij deze analyse ook gebruik werd gemaakt van Likelihood Ratios (LR’s), en de auteur beargumenteerde waarom dit superieur en noodzakelijk is – ongeveer zoals wij in onze eigen artikelen hebben gedaan. Onze beweegreden voor het gebruik van LR’s – die wij bij het begin van onze analyses hebben gebruikt, voordat er gegevens werden geanalyseerd, en net als in de eerder genoemde studie – was eenvoudigweg dat LR’s veel geschikter zijn en veel meer omvatten, omdat ze de sensitiviteit en specificiteit omvatten, die beide nodig zijn om de werkelijke waarde van de resultaten van een test af te leiden, en die superieur zijn aan voorspellende waarden (PV’s), omdat ze niet afhangen van de prevalentie van bijwerkingen. We hebben dit in detail besproken in onze papers, en anderen hebben deze aanpak specifiek ondersteund.

Andere, recent gepubliceerde analyses van drug toxicologie gegevens

Twee studies vergelijkbaar met de onze zijn gepubliceerd in het afgelopen jaar. Gezien onze belangstelling hiervoor, en gezien het ethische en wetenschappelijke belang van de kwestie, willen we een bijdrage leveren aan de discussie en het debat, door gebieden te belichten waarmee we het eens zijn en die we verwelkomen, maar ook enkele problemen die we hebben met die papers en hun conclusies.

Monticello et al.

Een studie die zich niet beperkt tot, maar zich baseert op, PV’s werd zeer recent gepubliceerd door Monticello et al. in november 2017 . Hoewel we de pogingen van de auteurs om deze controversiële en ondoorzichtige kwestie op te helderen verwelkomen en waarderen, zijn we van mening dat hun conclusie dat, “Deze resultaten ondersteunen het huidige regelgevingsparadigma van dierproeven bij het ondersteunen van veilige toegang tot klinische proeven en bieden context voor opkomende alternatieve modellen”, moet worden aangepakt.

In onze mening zijn er verschillende belangrijke voorbehouden. Misschien wel het meest in het oog springende is dat – hoewel de auteurs zowel PVs als LRs rapporteren – zij zich bijna uitsluitend richten op de Negative Predictive Value (NPV) om hun conclusie te ondersteunen. Dit is raadselachtig, gezien de aard van deze statistische maatstaven en de daaraan verbonden kwaliteiten en tekortkomingen, en vooral gezien het feit dat de auteurs een aantal daarvan specifiek bespreken alvorens ze uiteindelijk te negeren. Hoewel zij bijvoorbeeld toegeven dat LR’s “niet worden beïnvloed door de klinische positieve prevalentie” (waardoor zij volgens sommigen superieur zijn), belet dit de auteurs niet zich te concentreren op de PV’s, die wel door de toxiciteitsprevalentie worden beïnvloed.

Wij hebben in onze analyses vrij uitvoerig beargumenteerd waarom LR’s de voorkeur moeten krijgen boven PV’s , zoals hierboven vermeld. In de literatuur is hiervoor veel steun te vinden. In het kort beweren deskundigen dat LR’s de “optimale keuze” zijn, “informatiever dan PV’s”, en “de krachtigste indicator van diagnostisch nut”, omdat zij sensitiviteit en specificiteit omvatten, en onafhankelijk zijn van de prevalentie, waarmee rekening moet worden gehouden om de waarde van een test te schatten (zie ).

Monticello et al.leggen de nadruk op een hoge NPV “…grotendeels gebaseerd op de lage klinische positieve prevalentie die in onze databank en in de literatuur is waargenomen, wat kan worden toegeschreven aan het feit dat verbindingen die in de klinische ontwikkeling terechtkomen, doorgaans vele veiligheidshindernissen hebben genomen via uitgebreide in silico, in vitro en in vivo screeningactiviteiten voor optimalisering van de afleiding.” Toch lijkt het erop dat de auteurs de bijdrage van deze screeningactiviteiten over het hoofd zien, wanneer zij concluderen dat niet zij, maar het gebrek aan toxiciteit in dierproeven een gebrek aan toxiciteit in de kliniek voorspelt, in die mate zelfs dat zij het huidige paradigma steunen dat op dierproeven is gebaseerd. Wat ook hun conclusie in twijfel trekt – zelfs wanneer men het standpunt van de auteurs inneemt en de LR’s terzijde schuift om zich op de PV’s te concentreren – is dat hun berekende positieve PV’s (PPV’s) relatief laag waren (een gerapporteerd gemiddelde van slechts 36%, zelfs wanneer de laag scorende categorie “andere” organen buiten beschouwing werd gelaten); de auteurs verkozen te rapporteren dat er twee indrukwekkende waarden waren op de gerapporteerde 36, voor niet-menselijke primaten (NHP’s), in de categorieën zenuwstelsel en maag-darmkanaal. We moeten ons afvragen hoe dit “het huidige regelgevende paradigma van dierproeven kan ondersteunen”. Dierproeven worden niet alleen verondersteld te bestaan om “de veilige toegang tot klinische proeven te ondersteunen” door te voorspellen welke geneesmiddelen niet toxisch zouden kunnen zijn voor mensen – zij worden ook verondersteld te dienen als een efficiënt middel om te ontdekken welke geneesmiddelen schadelijk zouden kunnen zijn.

Wanneer men de LR’s in de analyse van Monticello e.a. onderzoekt in plaats van de PV’s (zie ons argument hierboven), komt een duidelijker beeld naar voren. De gerapporteerde inverse negatieve LR’s (iNLR’s) zijn inderdaad zeer laag – soms minder dan 1,0, en vaak nauwelijks groter dan 1,0 – hetgeen suggereert dat de dierproeven geen bewijskracht geven aan de waarschijnlijkheid dat een geneesmiddel bij de mens geen toxiciteit zal vertonen. Dit is precies de belangrijkste bevinding die wij in onze artikelen hebben vermeld en die ons argument onderbouwt dat de dierproeven niet geschikt zijn voor het beoogde doel. Zij rapporteren een gemiddelde iNLR van slechts 1,5-1,6, en een gemiddelde positieve LR (PLR) van 2,9. Dit zijn lage LR-waarden, die erop wijzen dat de dierproeven zeer weinig bewijskracht verlenen aan de waarschijnlijkheid van toxiciteit/afwezigheid van toxiciteit bij de mens. Zij rapporteren ook soortgelijke lage iNLR’s voor knaagdieren, honden en apen, zoals wij hebben gevonden. Kortom, in veel opzichten herhalen en versterken zij in feite onze bevindingen, in overeenstemming met hun verklaring in punt 2.7 van hun methoden, dat “als algemene regel geldt dat een test als ‘diagnostisch’ wordt beschouwd voor het voorspellen van een positief resultaat wanneer de LR+ >10 is of voor het voorspellen van een negatief resultaat wanneer de iLR- > 10 is”. Van hun 36 mogelijke resultaten voldeden slechts twee PLR’s/LR+ aan de door de auteurs erkende “diagnostische” definitie van een waarde van > = 10, en geen van de iNLR’s/iLR- deed dat. In feite waren 30 van de iLR- waarden < =2, waarvan de meeste in of rond de eenheid; d.w.z. zij leverden geen enkel bewijskrachtig bewijs op. Met andere woorden, volgens de definitie en de criteria die zij aanhalen, kunnen de dierproeven, op basis van hun gegevens en hun analyse, niet als diagnostisch/voorspellend worden beschouwd.

Wij stellen het op prijs dat de auteurs een aantal belangrijke punten over dit wetenschapsgebied in het algemeen erkennen, evenals enkele beperkingen van hun studie. Zoals wij in ons eigen werk hebben gedaan, maken zij melding van “beperkte” inspanningen om de waarde van dierproeven in het verleden te analyseren, en aanvaarden zij dat deze gebaseerd zijn op “historische precedenten” en een aanname van waarde. Wat hun analyse betreft, geven zij toe dat hun gegevens slechts 182 geneesmiddelen betroffen (vergeleken met onze > 3200, bijvoorbeeld); zij keken alleen naar overeenstemming tussen dierproeven en fase I, en namen klinische proeven van latere fasen niet mee, waarin meer geneesmiddelen zullen falen. Hun studie gebruikte ook weinig, brede categorieën voor bijwerkingen van geneesmiddelen (ADR’s), wat hun hypothese bevoordeelt in vergelijking met meer, en strengere, classificaties; en ze combineerden muizen en ratten als “één effectieve soort”, hoewel muizen en ratten vaak aanzienlijke verschillen in toxiciteit vertonen . Ten slotte meldden zij geen belangenconflicten, maar dankten zij bijna 20 biofarmaceutische bedrijven in hun dankwoord, en hebben zij banden met negen bedrijven. Hoewel wij geen ongepastheid suggereren, zouden sommigen kunnen aanvoeren dat zij een belang zouden kunnen hebben bij het rechtvaardigen van het historische en huidige gebruik van dieren bij het testen van geneesmiddelen door hun industrie en bedrijven.

Clark en Steger-Hartmann

Dit was een analyse van meer dan 3000 geneesmiddelen, gebaseerd op gegevens in Elsevier’s uitgebreide PharmaPendium database . De auteurs volgden een aanpak die vergelijkbaar is met de onze, door LR’s te gebruiken om het diagnostisch vermogen te bepalen van tests op dieren om informatie te geven over toxiciteit bij de mens, en concludeerden ook dat hun studie onze eigen saillante bevinding bevestigde: “…het ontbreken van deze gebeurtenissen in niet-klinische studies bleek geen goede voorspeller te zijn van veiligheid bij mensen, waardoor de bevindingen van Bailey et al. (2014) gedeeltelijk werden bevestigd. “.

Bevestiging van onze saillante bevinding is om twee redenen van het grootste belang. Ten eerste, hoewel we geen validatie zochten van onze eigen aanpak en publicaties, maar er altijd het volste vertrouwen in hebben gehad, waren sommige belanghebbenden met tegengestelde meningen over de waarde van op dieren gebaseerde medicijntesten erop uit om ons werk te denigreren. Ten tweede, hoe goed een dierproef ook de toxiciteit bij de mens kan voorspellen (hypothetisch), het is de afwezigheid van toxiciteit bij dieren die de kritieke factor is voor de voortgang van een nieuw geneesmiddel naar klinische proeven (bij de mens). Zoals wij blijven stellen, als dierproeven in dit cruciale opzicht falen – wat het geval lijkt te zijn – betekent dit niet alleen dat deze proeven niet geschikt zijn voor hun algemene doel (het identificeren van veilige en effectieve geneesmiddelen voor de mens), maar dit moet ook gevolgen hebben voor de farmaceutische industrie en haar regelgevers, en de manier waarop zij het testen van geneesmiddelen in het algemeen benaderen.

Dit artikel bevestigde ook onze andere hoofdbevinding, namelijk dat bijwerkingen in dierproeven in feite ook bij mensen kunnen optreden (hoewel, wat belangrijk is, vaak niet op een vergelijkbare manier). Cruciaal is echter dat wij de gevolgen van dit aspect anders hebben geïnterpreteerd. Zowel de auteurs van dit artikel als wijzelf vonden dit aspect zeer variabel, zonder een duidelijk patroon in termen van soorten toxische effecten of soorten geneesmiddelen. Daarom concludeerden wij dat dit niet als bijzonder relevant of betrouwbaar kan worden beschouwd. Clark en Steger-Hartmann gaven echter enkele voorbeelden van gevallen waarin dieren de toxiciteit voor de mens voorspelden, maar zij lieten niet zien, of wogen deze af tegen gebieden waar dit voorspellende aspect minder, niet-bestaand, of negatief was. Sommige van de voorbeelden die zij gaven, lagen zelfs maar net boven de statistische drempel die zij zelf hadden vastgesteld. Bijgevolg zijn wij van mening dat, hoewel zowel hun gegevens als onze eigen gegevens hun conclusie ondersteunen dat “bevestigd is dat de vertaling van veel belangrijke waarnemingen van dier naar mens voorspellend is”, zij niet hun conclusie ondersteunen dat hun studie “…de algemene voorspellende waarde van waarnemingen van dierlijke veiligheid voor de mens heeft bevestigd”. Dit wordt nog verergerd door zeer slecht voorspellende waarnemingen die alleen als ernstig kunnen worden beschouwd, zoals de dood, convulsies, bewegingsstoornissen en leveraandoeningen.

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.