Recenti sforzi per chiarire la validità scientifica dei test sui farmaci basati sugli animali da parte dell’industria farmaceutica, dei gruppi di pressione a favore dei test e delle organizzazioni per il benessere degli animali

Nov 20, 2021
admin

Risposte alle nostre analisi dei test tossicologici sui farmaci animali, e la continua difesa dei test sui farmaci animali

Dopo la pubblicazione di ciascuno dei nostri tre documenti complementari nel 2013, 2014 e 2015, abbiamo scritto a decine di rappresentanti di aziende farmaceutiche, regolatori e altre parti interessate, chiedendo un feedback, sperando così di costruire sul nostro lavoro e aprire un dialogo su questa importante questione, con implicazioni etiche per gli animali utilizzati, così come per gli utenti umani di farmaci. Deludentemente, sono state ricevute solo poche risposte, e quasi tutte erano formali e cortesi, ma non coinvolgenti. L’Associazione dell’industria farmaceutica britannica (ABPI) ha espresso alcune preoccupazioni su vari attributi del set di dati che abbiamo usato, ma la nostra risposta sostanziale e pubblicata ha costituito una confutazione completa. Forse tardivamente, il National Centre for the 3Rs (NC3Rs) del Regno Unito – nonostante la sua posizione inizialmente sprezzante – ha annunciato nell’estate del 2016 il proprio progetto di collaborazione con l’ABPI, per analizzare i dati dell’industria Naturalmente accogliamo con favore questo, a condizione, naturalmente, che sia fatto in modo trasparente e obiettivo, e preferibilmente con una supervisione indipendente. Il suo atteso rapporto era atteso per la fine del 2018, ma non è ancora stato annunciato al momento in cui scriviamo.

Nel frattempo, alcuni sostenitori dei test farmacologici sugli animali hanno continuato a sostenere che questi test hanno utilità, citando alcuni dei pochi, precedenti rapporti che suggeriscono che questo potrebbe essere il caso. Questo deve essere affrontato, perché questa conclusione non è supportata da quei documenti. Uno di questi rapporti, come abbiamo già discusso nel nostro lavoro, non ha stimato la specificità, senza la quale il peso probatorio verso la probabilità di tossicità/non tossicità umana fornito dai modelli animali – che è proprio quello che dobbiamo sapere – non può essere calcolato. Come hanno riconosciuto gli stessi autori dello studio citato, “Una valutazione più completa di questo aspetto della predittività sarà una parte importante di una futura indagine prospettica”. Un altro di questi rapporti citati ha mostrato che la prevedibilità umana per alcune aree terapeutiche è superiore al 90% – ma ha anche mostrato molte altre aree in cui i risultati degli studi sugli animali non sono riusciti a correlarsi significativamente con le osservazioni umane, che sono state trascurate. È importante notare che questa analisi ha utilizzato anche i Likelihood Ratios (LR), e l’autore ha argomentato perché questo è superiore e necessario, proprio come abbiamo fatto noi nei nostri articoli. La nostra logica per l’utilizzo di LR – in atto all’inizio delle nostre analisi, prima che qualsiasi dato fosse analizzato, e in comune con lo studio di cui sopra – era, semplicemente, perché gli LR sono molto più appropriati e inclusivi, incorporando sensibilità e specificità, entrambi necessari per derivare il vero valore dei risultati di qualsiasi test, e che sono superiori ai Valori Predittivi (PV), perché non dipendono dalla prevalenza degli effetti avversi. Ne abbiamo discusso in dettaglio nei nostri articoli, e altri hanno specificamente sostenuto questo approccio.

Altre analisi pubblicate di recente sui dati tossicologici dei farmaci

Due studi simili al nostro sono stati pubblicati nell’ultimo anno. Dato il nostro interesse per questo, e data l’importanza etica e scientifica della questione, desideriamo aggiungere alla discussione e al dibattito, evidenziando aree con cui siamo d’accordo e che accogliamo con favore, ma anche alcuni problemi che abbiamo con quei documenti e le loro conclusioni.

Monticello et al.

Uno studio non limitato a, ma che si basa su, PVs è stato molto recentemente pubblicato da Monticello et al. nel novembre 2017 . Mentre accogliamo e apprezziamo i tentativi degli autori di chiarire questa questione controversa e opaca, crediamo che la loro conclusione che, “Questi risultati supportano l’attuale paradigma normativo della sperimentazione animale nel sostenere l’ingresso sicuro negli studi clinici e forniscono un contesto per i modelli alternativi emergenti”, debba essere affrontata.

A nostro parere, ci sono diversi avvertimenti importanti. Forse il più saliente è che – mentre gli autori riportano sia i PV che i LR – si concentrano quasi esclusivamente sul valore predittivo negativo (NPV) per sostenere la loro conclusione. Questo è sconcertante, data la natura di queste metriche statistiche e le loro qualità e carenze associate, e soprattutto, dato che gli autori discutono specificamente alcune di esse prima di trascurarle alla fine. Per esempio, anche se ammettono che le LR “non sono influenzate dalla prevalenza clinica positiva” (che è il motivo per cui, alcuni sostengono, possono essere superiori), questo non impedisce agli autori di concentrarsi sulle PV, che sono influenzate dalla prevalenza della tossicità.

Noi, nelle nostre analisi, abbiamo sostenuto, in alcuni dettagli, perché le LR dovrebbero essere utilizzate in preferenza alle PV, come menzionato sopra. C’è un ampio sostegno a questo nella letteratura. In breve, gli esperti affermano che le LR sono la “scelta ottimale”, sono “più informative delle PV”, e sono “il singolo indicatore più potente di utilità diagnostica”, in quanto incorporano sensibilità e specificità, e sono indipendenti dalla prevalenza, che deve essere presa in considerazione per stimare il valore di un test (vedi ).

Monticello et al.L’enfasi di Monticello et al. su un elevato NPV è accettata per essere “…largamente basata sulla bassa prevalenza clinica positiva osservata nel nostro database e nella letteratura, che può essere attribuita al fatto che i composti che entrano nello sviluppo clinico hanno tipicamente superato molti ostacoli di sicurezza attraverso ampie attività di screening in silico, in vitro e in vivo per l’ottimizzazione dei lead.” Eppure, sembra che gli autori trascurino il contributo di queste attività di screening, quando concludono che non sono loro, ma la mancanza di tossicità nei test sugli animali, che predice una mancanza di tossicità clinicamente, al punto da sostenere l’attuale paradigma incentrato sulla sperimentazione animale. Ciò che mette in discussione la loro conclusione – anche prendendo la posizione degli autori e scavalcando le LR per concentrarsi sui PV – è che i loro PV positivi calcolati (PPV) erano relativamente bassi (una media riportata di appena il 36%, anche quando la categoria “altri” organi a basso punteggio è stata esclusa); gli autori hanno scelto di riportare che c’erano due valori impressionanti sui 36 riportati, per i primati non umani (NHP), nelle categorie sistema nervoso e gastrointestinale. Dobbiamo chiederci come questo possa “sostenere l’attuale paradigma normativo dei test sugli animali”. I test sugli animali non hanno la pretesa di esistere solo per “supportare l’ingresso sicuro negli studi clinici” prevedendo quali farmaci potrebbero non essere tossici per gli esseri umani – si pretende anche che servano come un mezzo efficiente per rilevare quali farmaci potrebbero essere dannosi.

Quando si esaminano le LR nell’analisi di Monticello et al. invece delle PV (vedi il nostro argomento sopra), emerge un quadro più chiaro. Le LR inverse negative riportate (iNLR) sono davvero molto basse – a volte meno di 1,0, e spesso appena superiori all’unità – il che suggerisce che i test sugli animali non forniscono alcun peso probatorio alla probabilità che un farmaco non mostri tossicità negli esseri umani. Questo è precisamente il risultato saliente che abbiamo riportato nei nostri articoli, e che sostiene la nostra tesi che i test sugli animali non sono adatti allo scopo. Essi riportano un iNLR medio di appena 1,5-1,6, e un LR positivo medio (PLR) di 2,9. Si tratta di valori LR bassi, che indicano che i test sugli animali hanno un peso probatorio molto basso sulla probabilità di tossicità/assenza di tossicità per l’uomo. Riportano anche iNLRs altrettanto poveri per roditori, cani e scimmie, come abbiamo trovato noi. In breve, in molti modi, in realtà ripetono e rafforzano i nostri risultati, in conformità con la loro dichiarazione nella sezione 2.7 dei loro metodi, che, “Come regola generale, un test è considerato ‘diagnostico’ nel prevedere un risultato positivo quando l’LR+ è >10 o per prevedere un risultato negativo quando l’iLR- è > 10.” Dei loro 36 risultati possibili, solo due LR+ hanno soddisfatto la definizione “diagnostica” riconosciuta dagli autori di un valore > = 10, e nessuno degli iNLRs/iLR- lo ha fatto. Infatti, 30 dei valori iLR- erano < =2, con la maggior parte di questi nell’unità o intorno ad essa; cioè non hanno fornito alcun peso probatorio. In altre parole, secondo la definizione e i criteri che citano, i test sugli animali, sulla base dei loro dati e della loro analisi, non possono essere considerati diagnostici/predittivi.

Abbiamo apprezzato che gli autori riconoscano alcuni punti importanti su questo settore della scienza in generale, così come alcune limitazioni del loro studio. Come abbiamo fatto noi nel nostro lavoro, essi riportano sforzi “limitati” per analizzare il valore dei test sugli animali in passato, e accettano che si basino su “precedenti storici” e su un’assunzione di valore. Per quanto riguarda la loro analisi, accettano che i loro dati hanno coinvolto solo 182 farmaci (rispetto ai nostri > 3200, per esempio); hanno guardato solo alla concordanza test animali/fase I, e non hanno incluso gli studi clinici di fase successiva, in cui più farmaci falliranno. Il loro studio ha anche usato poche e ampie categorie per le reazioni avverse ai farmaci (ADRs), il che favorisce la loro ipotesi rispetto a più e più severe classificazioni; e hanno combinato topi e ratti come ‘una specie efficace’, anche se topi e ratti spesso mostrano differenze significative nella tossicità. Infine, non hanno riportato alcun conflitto di interessi, ma hanno ringraziato quasi 20 aziende biofarmaceutiche nei loro ringraziamenti, e hanno affiliazioni a nove aziende. Mentre non suggeriamo alcuna scorrettezza, alcuni potrebbero sostenere che potrebbero avere un interesse a giustificare l’uso storico e attuale degli animali nella sperimentazione dei farmaci da parte della loro industria e delle aziende.

Clark e Steger-Hartmann

Questa era un’analisi di più di 3000 farmaci, basata sui dati nel completo database PharmaPendium di Elsevier. Gli autori hanno adottato un approccio simile al nostro, utilizzando LRs per determinare il potere diagnostico dei test negli animali per informare la tossicità umana, oltre a concludere che il loro studio ha confermato la nostra scoperta saliente: “…la mancanza di questi eventi negli studi non clinici è risultata non essere un buon predittore di sicurezza nell’uomo, confermando così in parte i risultati di Bailey et al. (2014). “.

La conferma della nostra scoperta saliente è della massima importanza per due motivi. In primo luogo, anche se non abbiamo cercato alcuna convalida del nostro approccio e delle nostre pubblicazioni, ma abbiamo sempre avuto la massima fiducia in esse, alcune parti interessate con opinioni opposte sul valore della sperimentazione dei farmaci su animali erano intenzionate a denigrare il nostro lavoro. In secondo luogo, non importa quanto bene qualsiasi test animale possa prevedere la tossicità umana (ipoteticamente), è l’assenza di tossicità negli animali che è il fattore critico per la progressione di un nuovo farmaco nella sperimentazione clinica (umana). Come continuiamo a sostenere, se i test sugli animali falliscono in questo aspetto cruciale – come sembra che facciano – questo non solo significa che quei test non sono adatti al loro scopo generale (identificare farmaci sicuri ed efficaci per l’uomo), ma questo deve avere ripercussioni per l’industria farmaceutica e i suoi regolatori, e il modo in cui affrontano i test sui farmaci in generale.

Questo documento ha anche confermato l’altra nostra scoperta principale, che suggerisce che le reazioni avverse nei test sugli animali sono, infatti, anche probabili negli esseri umani (anche se, cosa importante, spesso non in modo simile). In modo cruciale, tuttavia, abbiamo interpretato le conseguenze di questo aspetto in modo diverso. Sia gli autori di questo articolo, che noi stessi, abbiamo trovato questo aspetto molto variabile, senza un modello chiaro in termini di tipi di effetti tossici o di tipi di farmaci. Abbiamo quindi concluso che questo aspetto non può essere considerato particolarmente rilevante o affidabile. Clark e Steger-Hartmann, tuttavia, hanno fornito alcuni esempi di dove gli animali hanno predetto la tossicità umana, ma non hanno mostrato, o pesato questi contro, aree dove questo aspetto predittivo era inferiore, inesistente o negativo. Infatti, alcuni degli esempi che hanno fornito erano appena sopra la soglia statistica che loro stessi avevano fissato. Di conseguenza, crediamo che mentre sia i loro dati che i nostri dati supportano la loro conclusione che “La traduzione animale-uomo di molte osservazioni chiave è confermata come predittiva”, non supportano la loro conclusione che il loro studio “…ha confermato la predittività generale delle osservazioni sulla sicurezza animale per gli esseri umani”. Questo è aggravato da osservazioni molto poco predittive che possono essere considerate solo come gravi, come la morte, le convulsioni, i disturbi del movimento e i disturbi del fegato.

.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.