Recent efforts to elucidate the scientific validity of animal-based drug tests by the pharmaceutical industry, pro-testing lobby groups, and animal welfare organisations

Nov 20, 2021
admin

Responses to our analyses of animal drug/toxicology tests, e defesa contínua dos testes de drogas em animais

Na sequência da publicação de cada um dos nossos três, trabalhos complementares em 2013, 2014 e 2015, escrevemos a dezenas de representantes de empresas farmacêuticas, reguladores e outras partes interessadas, solicitando feedback, esperando assim desenvolver o nosso trabalho e abrir algum diálogo sobre esta importante questão, com implicações éticas para os animais utilizados, bem como para os utilizadores humanos de fármacos. Decepcionantemente, apenas foram recebidas poucas respostas, e quase todas elas foram formuladas e educadas, mas não engajadas. A Associação da Indústria Farmacêutica Britânica (ABPI) expressou algumas preocupações sobre vários atributos do conjunto de dados que utilizamos, mas a nossa resposta substancial, publicada, constituiu uma refutação total. Talvez tardiamente, o Centro Nacional para os 3Rs (NC3Rs) do Reino Unido – apesar da sua postura inicialmente desdenhosa – anunciou no Verão de 2016 o seu próprio projecto de colaboração com a ABPI, para analisar os dados da indústria. Seu ansiosamente esperado relatório era esperado no final de 2018, mas ainda não foi anunciado no momento em que foi escrito.

Entretanto, alguns defensores dos testes de drogas em animais continuaram a argumentar que esses testes têm utilidade, citando alguns dos poucos, relatórios anteriores sugerindo que este poderia ser o caso. Isto deve ser abordado, porque esta conclusão não é apoiada por esses artigos. Um desses relatos, como já discutimos em nosso trabalho, não estimou a especificidade, sem a qual o peso probatório para a probabilidade de toxicidade humana/não tóxica fornecido pelos modelos animais – que é precisamente o que precisamos saber – não pode ser calculado. Como os próprios autores do estudo citado reconheceram, “Uma avaliação mais completa deste aspecto de previsibilidade será uma parte importante de uma futura pesquisa prospectiva”. Outro relatório citado mostrou a previsibilidade humana para algumas áreas terapêuticas acima de 90% – e também mostrou muitas outras áreas onde os resultados de estudos com animais não conseguiram se correlacionar significativamente com observações humanas, que foram negligenciadas. É importante ressaltar que esta análise também utilizou a razão de verossimilhança (LRs), e o autor argumentou porque isso é superior e necessário – tanto quanto nós fizemos em nossos próprios trabalhos. O nosso raciocínio para a utilização de LR – no lugar em que se iniciou as nossas análises, antes de qualquer dado ser analisado, e em comum com o estudo acima mencionado – foi, simplesmente, porque as LRs são muito mais apropriadas e inclusivas, incorporando sensibilidade e especificidade, ambas necessárias para derivar o verdadeiro valor dos resultados de qualquer teste, e que são superiores aos Valores Preditivos (PVs), porque não dependem da prevalência de efeitos adversos. Discutimos isso em detalhes em nossos trabalhos, e outros apoiaram especificamente essa abordagem .

Outras análises recentes publicadas de dados toxicológicos de drogas

Dois estudos semelhantes aos nossos foram publicados no último ano. Dado o nosso interesse nisso, e dada a importância ética e científica do assunto, desejamos acrescentar à discussão e ao debate, destacando áreas com as quais concordamos e com as quais nos congratulamos, mas também algumas questões que temos com esses trabalhos e suas conclusões.

Monticello et al.

Um estudo não limitado a, mas confiante, PVs foi publicado muito recentemente por Monticello et al. em novembro de 2017 . Embora saudemos e apreciemos as tentativas dos autores para elucidar esta questão controversa e opaca, acreditamos que a sua conclusão de que, “Estes resultados apoiam o actual paradigma regulador dos testes em animais no apoio à entrada segura em ensaios clínicos e fornecem contexto para modelos alternativos emergentes”, deve ser abordada.

Na nossa opinião, existem várias advertências importantes. Talvez o mais importante seja que – enquanto os autores relatam tanto PVs quanto LRs – eles se concentram quase que exclusivamente no Valor Preditivo Negativo (VPL) para apoiar a sua conclusão. Isto é intrigante, dada a natureza dessas métricas estatísticas e suas qualidades e deficiências associadas, e especialmente, dado que os autores discutem especificamente algumas delas antes de finalmente ignorá-las. Por exemplo, embora admitam que as RV “não são influenciadas pela prevalência clínica positiva” (razão pela qual, alguns afirmam, podem ser superiores), isso não impede que os autores se concentrem nas RV, que são influenciadas pela prevalência da toxicidade.

Nós, em nossas análises, argumentamos, com algum detalhe, porque as RV devem ser usadas em preferência às RV , como mencionado acima. Há um apoio abundante para isso na literatura. Em resumo, especialistas afirmam que os RVs são a “escolha ótima”, são “mais informativos que as PVs”, e são “o indicador mais poderoso de utilidade diagnóstica”, pois incorporam sensibilidade e especificidade, e são independentes da prevalência, que deve ser levada em conta para estimar o valor de um teste (ver ).

Monticello et al.A ênfase de Monticello et al. ‘s em um VPL alto é aceita como “…largamente baseada na baixa prevalência clínica positiva observada em nossa base de dados e na literatura, o que pode ser atribuído ao fato de que os compostos que entram no desenvolvimento clínico têm tipicamente eliminado muitos obstáculos de segurança através de atividades de triagem extensiva em silico, in vitro e in vivo de otimização de chumbo”. No entanto, parece que os autores ignoram a contribuição dessas atividades de triagem, quando concluem que não são elas, mas a falta de toxicidade em testes em animais, o que prevê uma falta de toxicidade clinicamente, na medida em que suportam o paradigma atual centrado em testes em animais. O que também desafia sua conclusão – mesmo tomando a posição dos autores e deixando de lado as RVs para se concentrar nas PVs – é que as PVs Positivas (PPVs) calculadas foram relativamente baixas (média relatada de apenas 36%, mesmo quando a categoria de ‘outros’ órgãos com baixa pontuação foi excluída); os autores optaram por relatar que havia dois valores impressionantes dentre os 36 relatados, para primatas não humanos (PNCs), nas categorias do sistema nervoso e gastrointestinais. Devemos questionar como isso pode “suportar o atual paradigma regulatório dos testes em animais”. Os testes em animais não existem apenas para “apoiar a entrada segura em ensaios clínicos”, prevendo quais as drogas que podem não ser tóxicas para os seres humanos – eles também servem como um meio eficiente de detectar quais drogas podem ser prejudiciais.

Quando se examina os LRs na análise de Monticello et al. em vez dos PVs (veja nosso argumento acima), emerge um quadro mais claro. Os LRs negativos inversos relatados (iNLRs) são muito baixos – algumas vezes inferiores a 1,0, e muitas vezes mal maiores que a unidade – o que sugere que os testes em animais não estão fornecendo nenhum peso probabilístico à probabilidade de que uma droga não mostre toxicidade em humanos. Esta é precisamente a descoberta mais importante que relatamos em nossos trabalhos, e que sustenta nosso argumento de que os testes em animais não são adequados para o propósito. Eles relatam um iNLR médio de apenas 1,5-1,6, e um LR médio Positivo (PLR) de 2,9. Estes são valores baixos de LR, o que indica que muito pouco peso probatório está sendo fornecido pelos testes em animais para a probabilidade de toxicidade humana/ausência de toxicidade. Eles também relatam iNLRs igualmente pobres para roedores, cães e macacos, como nós encontramos. Em resumo, de muitas maneiras, eles realmente repetem e reforçam nossos achados, de acordo com sua afirmação na seção 2.7 de seus Métodos, que, “Como regra geral, um teste é considerado ‘diagnóstico’ ao prever um resultado positivo quando o LR+ é >10 ou para prever um resultado negativo quando o iLR- é > 10”. Dos seus 36 resultados possíveis, apenas dois PLRs/LR+ encontraram a definição ‘diagnóstica’ reconhecida pelos autores de um valor de > = 10, e nenhum dos iNLRs/iLR- o fez. Na verdade, 30 dos valores iLR- foram < =2, com a maioria deles na unidade ou em torno dela; ou seja, não forneceram nenhum peso probatório. Em outras palavras, pela definição e critérios que citam, os testes em animais, com base em seus dados e sua análise, não podem ser considerados diagnósticos/preditivos.

Apreciamos que os autores reconhecem alguns pontos importantes sobre esta área da ciência em geral, bem como algumas limitações de seu estudo. Como fizemos em nosso próprio trabalho, eles relatam esforços “limitados” para analisar o valor dos testes em animais no passado, e aceitam que eles se baseiam em “precedência histórica” e em uma suposição de valor. Com relação à sua análise, eles aceitam que seus dados envolveram apenas 182 medicamentos (em comparação com os nossos > 3200, por exemplo); eles olharam apenas para testes em animais/fase I de concordância, e não incluíram testes clínicos de fase posterior, nos quais mais medicamentos falharão. Seu estudo também utilizou poucas e amplas categorias de reações adversas a drogas (RAMs), o que favorece suas hipóteses em comparação com classificações mais e mais rigorosas; e combinaram ratos e ratos como “uma espécie eficaz”, apesar de ratos e ratos frequentemente apresentarem diferenças significativas de toxicidade. Finalmente, eles não relataram conflitos de interesse, mas agradeceram a quase 20 empresas biofarmacêuticas em seus reconhecimentos, e têm afiliações a nove empresas. Apesar de não sugerirmos nenhuma impropriedade, alguns poderiam argumentar que poderiam ter interesse em justificar o uso histórico e atual da indústria e das empresas em testes de medicamentos.

Clark e Steger-Hartmann

Esta foi uma análise de mais de 3000 medicamentos, baseada em dados do abrangente banco de dados PharmaPendium da Elsevier. Os autores adotaram uma abordagem semelhante à nossa, usando LRs para determinar o poder diagnóstico de testes em animais para informar a toxicidade humana, bem como concluindo que seu estudo confirmou nosso próprio achado saliente: “…a falta destes eventos em estudos não clínicos foi considerada como não sendo um bom preditor de segurança em humanos, confirmando parcialmente os achados de Bailey et al. (2014). “.

Confirmação do nosso achado saliente é da maior importância por duas razões. Primeiro, embora não tenhamos procurado validar a nossa própria abordagem e publicações, mas sempre tivemos a máxima confiança nelas, algumas partes interessadas com opiniões opostas sobre o valor dos testes de drogas com base em animais tinham a intenção de denegrir o nosso trabalho. Em segundo lugar, não importa quão bem qualquer teste em animais possa prever a toxicidade em humanos (hipoteticamente), é a ausência de toxicidade em animais que é o fator crítico para a progressão de um novo medicamento em testes clínicos (humanos). Como continuamos a argumentar, se os testes em animais falharem nesse aspecto crucial – como eles parecem fazer – isso não só significa que esses testes não são adequados para seu propósito geral (identificar drogas humanas seguras e eficazes), mas isso deve ter repercussões para a indústria farmacêutica e seus reguladores, e como eles abordam os testes de drogas em geral.

Este artigo também confirmou nossa outra principal descoberta, que sugeriu que as reações adversas em testes em animais são, de fato, também prováveis de ocorrer em humanos (embora, o que é importante, muitas vezes não de maneira semelhante). No entanto, de forma crucial, temos interpretado as consequências deste aspecto de forma diferente. Tanto os autores deste trabalho, como nós mesmos, achamos este aspecto muito variável, sem um padrão claro em termos de tipos de efeitos tóxicos ou tipos de drogas. Concluímos, portanto, que este aspecto não pode ser considerado particularmente relevante ou confiável. Clark e Steger-Hartmann, no entanto, forneceram alguns exemplos de onde os animais prediziam a toxicidade humana, mas não mostravam, ou pesavam, áreas onde esse aspecto preditivo era menor, inexistente ou negativo. De fato, alguns dos exemplos que eles forneceram estavam apenas um pouco acima do limiar estatístico que eles próprios tinham estabelecido. Consequentemente, acreditamos que, embora tanto os seus dados como os nossos apoiem a sua conclusão de que “a tradução animal-humana de muitas observações-chave é confirmada como sendo preditiva”, eles não apoiam a sua conclusão de que o seu estudo “…confirmou a previsibilidade geral das observações de segurança animal para os seres humanos”. Isto é agravado por observações muito pouco preditivas que só podem ser consideradas graves, tais como morte, convulsões, distúrbios de movimento e doenças hepáticas.

Deixe uma resposta

O seu endereço de email não será publicado.