Eforturi recente de elucidare a validității științifice a testelor medicamentoase pe bază de animale de către industria farmaceutică, grupurile de lobby pro-testare și organizațiile pentru bunăstarea animalelor
Răspunsuri la analizele noastre privind testele medicamentoase/toxicologice pe animale, și apărarea în continuare a testării medicamentelor pe animale
După publicarea fiecăruia dintre cele trei documente complementare ale noastre în 2013, 2014 și 2015, am scris la zeci de reprezentanți ai companiilor farmaceutice, autorităților de reglementare și altor părți interesate, solicitând feedback, sperând astfel să ne bazăm pe munca noastră și să deschidem un dialog cu privire la această problemă importantă, cu implicații etice pentru animalele utilizate, precum și pentru utilizatorii umani de produse farmaceutice. În mod dezamăgitor, am primit doar puține răspunsuri, și aproape toate au fost formulare, politicoase, dar nu și interesante. Asociația Industriei Farmaceutice Britanice (Association of the British Pharmaceutical Industry – ABPI) și-a exprimat unele îngrijorări cu privire la diverse atribute ale setului de date pe care l-am folosit, dar răspunsul nostru substanțial, publicat, a constituit o replică completă. Poate cu întârziere, Centrul Național pentru cele 3R din Marea Britanie (NC3Rs) – în ciuda poziției sale inițiale disprețuitoare – a anunțat în vara anului 2016 propriul său proiect de colaborare cu ABPI, pentru a analiza datele din industrie Salutăm, în mod firesc, acest lucru, cu condiția, desigur, ca acesta să fie realizat în mod transparent și obiectiv și, de preferință, cu o supraveghere independentă. Raportul său, așteptat cu nerăbdare, era așteptat la sfârșitul anului 2018, dar încă nu a fost anunțat la momentul redactării acestui articol.
Între timp, unii susținători ai testelor de medicamente pe animale au continuat să susțină că aceste teste au utilitate, citând unele dintre puținele rapoarte anterioare care sugerează că acest lucru ar putea fi cazul. Acest lucru trebuie abordat, deoarece această concluzie nu este susținută de acele lucrări. Unul dintre aceste rapoarte , așa cum am discutat deja în lucrarea noastră, nu a estimat specificitatea, fără de care nu poate fi calculată ponderea probatorie în ceea ce privește probabilitatea de toxicitate/netoxicitate la om oferită de modelele animale – ceea ce este exact ceea ce trebuie să știm – nu poate fi calculată. După cum au recunoscut chiar autorii studiului citat, „O evaluare mai completă a acestui aspect al predictivității va fi o parte importantă a unui viitor studiu prospectiv”. Un alt astfel de raport citat a arătat că predictibilitatea umană pentru unele domenii terapeutice a fost de peste 90% – însă a arătat, de asemenea, multe alte domenii în care rezultatele studiilor pe animale nu au reușit să se coreleze în mod semnificativ cu observațiile umane, care au fost trecute cu vederea. Este important faptul că această analiză a utilizat, de asemenea, ratele de verosimilitate (LR), iar autorul a argumentat de ce acest lucru este superior și necesar – la fel cum am făcut și noi în propriile noastre lucrări. Raționamentul nostru pentru utilizarea LR – în vigoare încă de la începutul analizelor noastre, înainte de analizarea oricăror date, și în comun cu studiul menționat mai sus – a fost, pur și simplu, pentru că LR sunt mult mai adecvate și mai cuprinzătoare, încorporând sensibilitatea și specificitatea, ambele necesare pentru a obține valoarea reală a rezultatelor oricărui test, și care sunt superioare valorilor predictive (PV), deoarece nu depind de prevalența efectelor adverse. Am discutat acest lucru în detaliu în lucrările noastre, iar alții au susținut în mod specific această abordare .
Alte analize publicate recent ale datelor toxicologice ale medicamentelor
Două studii similare cu al nostru au fost publicate în ultimul an. Având în vedere interesul nostru în acest sens și având în vedere importanța etică și științifică a problemei, dorim să ne adăugăm la discuție și dezbatere, evidențiind domeniile cu care suntem de acord și pe care le salutăm, dar și unele probleme pe care le avem cu aceste lucrări și cu concluziile lor.
Monticello et al.
Un studiu care nu se limitează la, dar se bazează pe PV-uri a fost publicat foarte recent de Monticello et al. în noiembrie 2017 . Deși salutăm și apreciem încercările autorilor de a elucida această problemă controversată și opacă, considerăm că trebuie abordată concluzia lor conform căreia „Aceste rezultate susțin paradigma actuală de reglementare a testelor pe animale în susținerea intrării în siguranță în studiile clinice și oferă context pentru modele alternative emergente”.
În opinia noastră, există mai multe avertismente importante. Poate cea mai evidentă este faptul că – deși autorii raportează atât PV cât și LR – ei se concentrează aproape exclusiv pe valoarea predictivă negativă (NPV) pentru a-și susține concluzia. Acest lucru este derutant, având în vedere natura acestor măsurători statistice și calitățile și deficiențele lor asociate și, mai ales, având în vedere că autorii discută în mod specific unele dintre ele înainte de a le trece în cele din urmă cu vederea. De exemplu, chiar dacă admit că LR „nu sunt influențate de prevalența pozitivă clinică” (motiv pentru care, afirmă unii, ar putea fi superioare), acest lucru nu îi împiedică pe autori să se concentreze în continuare asupra PV, care sunt influențate de prevalența toxicității.
Noi, în analizele noastre, am argumentat, în detaliu, de ce LR ar trebui să fie utilizate cu precădere LR în locul PV , așa cum am menționat mai sus. Există un sprijin abundent în literatura de specialitate pentru acest lucru. Pe scurt, experții afirmă că LR-urile sunt „alegerea optimă”, sunt „mai informative decât PV-urile” și sunt „cel mai puternic indicator unic al utilității diagnosticului”, deoarece încorporează sensibilitatea și specificitatea și sunt independente de prevalență, care trebuie luată în considerare pentru a estima valoarea unui test (a se vedea ).
Monticello et al.’s accentuează pe o valoare NPV ridicată se acceptă că se bazează „…în mare parte pe prevalența pozitivă clinică scăzută observată în baza noastră de date și în literatura de specialitate, care poate fi atribuită faptului că compușii care intră în dezvoltarea clinică au depășit de obicei multe obstacole de siguranță prin intermediul unor activități extinse de screening de optimizare a pistei in silico, in vitro și in vivo”. Cu toate acestea, se pare că autorii trec cu vederea contribuția acestor activități de screening, atunci când concluzionează că nu acestea, ci lipsa de toxicitate în cadrul testelor pe animale, sunt cele care prezic lipsa de toxicitate din punct de vedere clinic, în măsura în care susțin paradigma actuală centrată pe testele pe animale. Ceea ce pune în discuție, de asemenea, concluzia lor – chiar dacă se ia în considerare poziția autorilor și se ocolește LR pentru a se concentra asupra PV – este faptul că PV pozitive (PPV) calculate de aceștia au fost relativ scăzute (o medie raportată de doar 36 %, chiar și atunci când a fost exclusă categoria de organe „alte organe” cu punctaj scăzut); autorii au ales să raporteze că au existat două valori impresionante din cele 36 raportate, pentru primatele neumane (NHP), în categoriile sistem nervos și gastrointestinal. Trebuie să ne întrebăm cum poate acest lucru să „susțină paradigma actuală de reglementare a testării pe animale”. Testele pe animale nu se presupune că există doar pentru a „sprijini intrarea în siguranță în testele clinice” prin prezicerea medicamentelor care ar putea să nu fie toxice pentru oameni – se presupune, de asemenea, că acestea servesc ca mijloc eficient de detectare a medicamentelor care ar putea fi dăunătoare.
Când se examinează LR din analiza lui Monticello et al. în loc de PV (a se vedea argumentul nostru de mai sus), apare o imagine mai clară. LR-urile negative inverse raportate (iNLR-urile) sunt într-adevăr foarte scăzute – uneori mai mici de 1,0 și adesea abia dacă depășesc unitatea – ceea ce sugerează că testele pe animale nu oferă nicio greutate evidentă pentru probabilitatea ca un medicament să nu prezinte toxicitate la om. Aceasta este exact constatarea evidentă pe care am raportat-o în lucrările noastre și care susține argumentul nostru conform căruia testele pe animale nu sunt adecvate scopului. Ei raportează un iNLR mediu de doar 1,5-1,6 și un LR pozitiv (PLR) mediu de 2,9. Acestea sunt valori LR scăzute, care indică faptul că testele pe animale au o pondere foarte mică în ceea ce privește probabilitatea de toxicitate/absență a toxicității la om. Ei raportează, de asemenea, iNLR-uri la fel de slabe pentru rozătoare, câini și maimuțe, așa cum am constatat și noi. Pe scurt, în multe privințe, ei de fapt repetă și întăresc constatările noastre, în conformitate cu afirmația lor din secțiunea 2.7 din metodele lor, conform căreia: „Ca regulă generală, un test este considerat „diagnostic” pentru a prezice un rezultat pozitiv atunci când LR+ este >10 sau pentru a prezice un rezultat negativ atunci când iLR- este > 10″. Dintre cele 36 de rezultate posibile, doar două PLR/LR+ au respectat definiția „diagnostică” recunoscută de autori a unei valori de > = 10, iar niciunul dintre iNLR/iLR- nu a făcut acest lucru. De fapt, 30 dintre valorile iLR- au fost < =2, cele mai multe dintre acestea fiind în sau în jurul valorii de unitate; adică nu au oferit nicio greutate evidențială. Cu alte cuvinte, conform definiției și criteriilor pe care le citează, testele pe animale, pe baza datelor și a analizei lor, nu pot fi considerate ca fiind diagnostice/predictive.
Apreciem că autorii recunosc unele puncte importante despre acest domeniu al științei în general, precum și unele limitări ale studiului lor. Așa cum am făcut și noi în propria noastră lucrare, ei raportează eforturile „limitate” de a analiza valoarea testelor pe animale în trecut și acceptă că acestea se bazează pe „precedentul istoric” și pe o presupunere a valorii. În ceea ce privește analiza lor, ei acceptă că datele lor au implicat doar 182 de medicamente (în comparație cu cele > 3200 ale noastre, de exemplu); au analizat doar concordanța dintre testele pe animale și faza I și nu au inclus testele clinice din fazele ulterioare, în care mai multe medicamente vor eșua. Studiul lor a folosit, de asemenea, puține categorii largi pentru reacțiile adverse ale medicamentelor (ADR), ceea ce favorizează ipoteza lor în comparație cu clasificări mai multe și mai riguroase; și au combinat șoarecii și șobolanii ca „o singură specie eficientă”, chiar dacă șoarecii și șobolanii prezintă adesea diferențe semnificative în ceea ce privește toxicitatea . În cele din urmă, ei nu au raportat niciun conflict de interese, dar au mulțumit aproape 20 de companii biofarmaceutice în mulțumirile lor, și au afilieri la nouă companii. Deși nu sugerăm nicio neregularitate, unii ar putea susține că ar putea avea un interes în justificarea utilizării istorice și actuale a animalelor în testarea medicamentelor de către industria și companiile lor.
Clark și Steger-Hartmann
Aceasta a fost o analiză a mai mult de 3000 de medicamente, bazată pe datele din baza de date cuprinzătoare PharmaPendium a Elsevier . Autorii au adoptat o abordare similară cu a noastră, utilizând LR pentru a determina puterea de diagnosticare a testelor pe animale pentru a informa cu privire la toxicitatea umană, precum și pentru a concluziona că studiul lor a confirmat propria noastră constatare proeminentă: „…s-a constatat că lipsa acestor evenimente în studiile nonclinice nu este un bun predictor al siguranței la om, confirmând astfel parțial constatările lui Bailey et al. (2014). „.
Confirmarea constatării noastre proeminente este de cea mai mare importanță din două motive. În primul rând, deși nu am căutat nicio validare a propriei noastre abordări și publicații, ci am avut întotdeauna cea mai mare încredere în ele, unele părți interesate cu opinii opuse cu privire la valoarea testării medicamentelor pe animale au avut intenția de a ne denigra activitatea. În al doilea rând, indiferent cât de bine ar putea orice test pe animale să prezică (ipotetic) toxicitatea la om, absența toxicității la animale este factorul critic pentru evoluția unui nou medicament în studiile clinice (la om). După cum continuăm să susținem, dacă testele pe animale eșuează în această privință crucială – așa cum se pare că se întâmplă – acest lucru nu numai că înseamnă că acele teste nu sunt potrivite pentru scopul lor general (identificarea de medicamente sigure și eficiente pentru oameni), dar acest lucru trebuie să aibă repercusiuni asupra industriei farmaceutice și a autorităților sale de reglementare, precum și asupra modului în care acestea abordează testarea medicamentelor în general.
Acest articol a confirmat, de asemenea, cealaltă constatare principală a noastră, care a sugerat că reacțiile adverse din testele pe animale sunt, de fapt, susceptibile de a apărea și la oameni (deși, lucru important, adesea nu într-un mod similar). În mod crucial, însă, am interpretat diferit consecințele acestui aspect. Atât autorii acestei lucrări, cât și noi înșine, am constatat că acest aspect este foarte variabil, fără un model clar în ceea ce privește tipurile de efecte toxice sau tipurile de medicamente. Prin urmare, am concluzionat că acest aspect nu poate fi considerat deosebit de relevant sau de fiabil. Cu toate acestea, Clark și Steger-Hartmann au oferit câteva exemple de cazuri în care animalele au prezis toxicitatea umană, dar nu au arătat sau nu au pus în balanță domeniile în care acest aspect predictiv a fost mai scăzut, inexistent sau negativ. Într-adevăr, unele dintre exemplele pe care le-au furnizat au depășit cu puțin pragul statistic pe care ei înșiși l-au stabilit. În consecință, considerăm că, în timp ce atât datele lor, cât și datele noastre susțin concluzia lor conform căreia „Transpunerea de la animal la om a multor observații cheie este confirmată ca fiind predictivă”, acestea nu susțin concluzia că studiul lor „…a confirmat caracterul predictiv general al observațiilor privind siguranța animalelor pentru oameni”. Acest lucru este agravat de observațiile foarte slab predictive care nu pot fi considerate decât grave, cum ar fi moartea, convulsiile, tulburările de mișcare și tulburările hepatice.
.