A gyógyszeripar, a tesztelést támogató lobbicsoportok és az állatjóléti szervezetek legújabb erőfeszítései az állatkísérletes gyógyszerkísérletek tudományos érvényességének tisztázására

nov 20, 2021
admin

Válaszok az állati gyógyszer/toxikológiai tesztekkel kapcsolatos elemzéseinkre, és az állatkísérletes gyógyszerkísérletek további védelme

A 2013-ban, 2014-ben és 2015-ben megjelent három, egymást kiegészítő írásunk mindegyikét követően több tucatnyi gyógyszeripari vállalat, szabályozó hatóság és más érdekelt fél képviselőjének írtunk, és kértünk visszajelzést, remélve ezáltal, hogy munkánkra építve párbeszédet kezdeményezhetünk erről a fontos kérdésről, amelynek etikai vonatkozásai vannak a felhasznált állatokra, valamint a gyógyszerek emberi felhasználóira nézve is. Csalódást keltő módon csak kevés válasz érkezett, és szinte mindegyik formulaszerű volt, udvarias, de nem volt megnyerő. A Brit Gyógyszeripari Szövetség (Association of the British Pharmaceutical Industry – ABPI) aggodalmának adott hangot az általunk használt adatsor különböző jellemzőivel kapcsolatban, de a mi jelentős, közzétett válaszunk teljes körű cáfolatot jelentett. Talán megkésve, de az Egyesült Királyság Nemzeti 3R-központja (NC3Rs) – a kezdetben elutasító álláspontja ellenére – 2016 nyarán bejelentette saját, az ABPI-vel közös projektjét az iparági adatok elemzésére. A várva várt jelentését 2018 végére várták, de e sorok írásakor még mindig nem jelentették be.

Eközben az állatkísérletes gyógyszerkísérletek egyes hívei továbbra is azzal érveltek, hogy ezek a vizsgálatok hasznosak, hivatkozva néhány olyan kevés, korábbi jelentésre, amelyek erre utalnak. Ezzel foglalkozni kell, mert ezt a következtetést ezek a tanulmányok nem támasztják alá. Az egyik ilyen jelentés , amint azt már tárgyaltuk munkánkban, nem becsülte meg a specificitást, ami nélkül nem lehet kiszámítani az állatmodellek által az emberi toxicitás/nem toxicitás valószínűségére vonatkozó bizonyító erejű súlyt – amit pontosan tudnunk kell -. Amint azt maguk az idézett tanulmány szerzői is elismerték: “Ennek a prediktivitási szempontnak a teljesebb értékelése fontos része lesz egy jövőbeli prospektív felmérésnek”. Egy másik ilyen idézett jelentés szerint a humán előrejelezhetőség egyes terápiás területeken 90% feletti – ugyanakkor számos más olyan területet is kimutatott, ahol az állatkísérletek eredményei nem korreláltak szignifikánsan az emberi megfigyelésekkel, amelyeket figyelmen kívül hagytak. Fontos, hogy ez az elemzés a valószínűségi arányokat (Likelihood Ratios, LR) is felhasználta, és a szerző azzal érvelt, hogy ez miért jobb és miért szükséges – hasonlóan ahhoz, ahogy mi is tettük a saját cikkeinkben. A mi indoklásunk az LR-ek használatára – az elemzéseink kezdetén, az adatok elemzése előtt, és a fent említett tanulmányhoz hasonlóan – egyszerűen az volt, hogy az LR-ek sokkal megfelelőbbek és inkluzívabbak, magukban foglalják az érzékenységet és a specificitást, amelyek mindkettő szükséges bármely vizsgálat eredményeinek valódi értékének levezetéséhez, és amelyek jobbak, mint a prediktív értékek (PV), mivel nem függnek a káros hatások gyakoriságától. Ezt részletesen tárgyaltuk cikkeinkben, és mások kifejezetten támogatták ezt a megközelítést .

A gyógyszer-toxikológiai adatok egyéb, nemrégiben közzétett elemzései

Az elmúlt évben két, a miénkhez hasonló tanulmányt tettek közzé. Tekintettel az ezzel kapcsolatos érdeklődésünkre, valamint a kérdés etikai és tudományos jelentőségére, szeretnénk hozzájárulni a vitához és a vitához, kiemelve azokat a területeket, amelyekkel egyetértünk, és amelyeket üdvözlünk, de néhány olyan kérdést is, amelyekkel kapcsolatban problémáink vannak ezekkel a tanulmányokkal és következtetéseikkel.

Monticello et al.

Egy nem csak a PV-kre korlátozódó, de azokra támaszkodó tanulmányt Monticello et al. nagyon nemrég, 2017 novemberében publikált . Bár üdvözöljük és értékeljük a szerzők kísérletét ennek az ellentmondásos és átláthatatlan kérdésnek a megvilágítására, úgy véljük, hogy foglalkozni kell a következtetésükkel, miszerint “Ezek az eredmények támogatják az állatkísérletek jelenlegi szabályozási paradigmáját a klinikai vizsgálatokba való biztonságos belépés támogatásában, és összefüggést biztosítanak a kialakuló alternatív modellek számára.”

Véleményünk szerint több fontos fenntartás van. Talán a legkiemelkedőbb az, hogy – bár a szerzők mind a PV-ről, mind az LR-ről beszámolnak – következtetésük alátámasztására szinte kizárólag a negatív prediktív értékre (NPV) összpontosítanak. Ez rejtélyes, tekintettel ezeknek a statisztikai mérőszámoknak a természetére és a hozzájuk kapcsolódó tulajdonságokra és hiányosságokra, és különösen annak fényében, hogy a szerzők kifejezetten tárgyalnak néhányat közülük, mielőtt végül figyelmen kívül hagyják őket. Például, bár elismerik, hogy az LR-eket “nem befolyásolja a klinikai pozitív prevalencia” (ezért – egyesek állítása szerint – jobbak lehetnek), ez nem akadályozza meg a szerzőket abban, hogy a továbbiakban a PV-kre koncentráljanak, amelyeket a toxicitás prevalenciája befolyásol.

Elemzéseinkben részletesen érveltünk amellett, hogy miért kell az LR-eket a PV-kkel szemben előnyben részesíteni , amint azt fentebb említettük. Ezt a szakirodalom bőségesen alátámasztja. Röviden, a szakértők azt állítják, hogy az LR-ek az “optimális választás”, “informatívabbak, mint a PV-ek”, és “a diagnosztikai hasznosság egyetlen legerősebb mutatója”, mivel magukban foglalják az érzékenységet és a specificitást, és függetlenek a prevalenciától, amelyet figyelembe kell venni a teszt értékének becsléséhez (lásd ).

Monticello et al.a magas NPV hangsúlyozását úgy fogadják el, hogy “…nagyrészt az adatbázisunkban és a szakirodalomban megfigyelt alacsony klinikai pozitív prevalencián alapul, ami annak tulajdonítható, hogy a klinikai fejlesztésbe belépő vegyületek jellemzően számos biztonsági akadályt leküzdöttek a kiterjedt in silico, in vitro és in vivo ólomoptimalizálási szűrési tevékenységek révén”. Úgy tűnik azonban, hogy a szerzők figyelmen kívül hagyják e szűrési tevékenységek hozzájárulását, amikor arra a következtetésre jutnak, hogy nem ők, hanem az állatkísérletekben tapasztalt toxicitás hiánya az, ami a klinikai toxicitás hiányát jelzi előre, olyannyira, hogy támogatják az állatkísérletekre összpontosító jelenlegi paradigmát. Ami szintén megkérdőjelezi a következtetésüket – még ha a szerzők álláspontját vesszük is alapul, és az LR-eket megkerülve a PV-kre koncentrálnak -, az az, hogy az általuk számított pozitív PV-k (PPV-k) viszonylag alacsonyak voltak (a bejelentett átlag mindössze 36%, még akkor is, ha az alacsony pontszámú “egyéb” szervi kategóriát kizárták); a szerzők úgy döntöttek, hogy a 36 bejelentett értékből két lenyűgöző értéket jelentenek a főemlős állatok (NHP-k) esetében, az idegrendszer és a gyomor-bélrendszer kategóriákban. Meg kell kérdeznünk, hogy ez hogyan “támogathatja az állatkísérletek jelenlegi szabályozási paradigmáját”. Az állatkísérletek állítólag nem csak azért léteznek, hogy “támogassák a klinikai vizsgálatokba való biztonságos belépést” azáltal, hogy megjósolják, mely gyógyszerek nem lehetnek mérgezőek az emberekre – állítólag hatékony eszközként szolgálnak annak kimutatására is, mely gyógyszerek lehetnek károsak.”

Ha a PV-értékek helyett a Monticello et al. elemzésében az LR-értékeket vizsgáljuk (lásd a fenti érvelésünket), tisztább kép rajzolódik ki. A jelentett inverz negatív LR-ek (iNLR-ek) valóban nagyon alacsonyak – néha 1,0-nál kisebbek, és gyakran alig nagyobbak egységnél -, ami arra utal, hogy az állatkísérletek nem adnak bizonyító erejű súlyt annak valószínűségére, hogy egy gyógyszer emberben nem mutat toxicitást. Pontosan ez az a kiemelkedő megállapítás, amelyről a cikkeinkben beszámoltunk, és amely alátámasztja azt az érvelésünket, hogy az állatkísérletek nem alkalmasak a célnak. Az iNLR átlaga mindössze 1,5-1,6, az átlagos pozitív LR (PLR) pedig 2,9 volt. Ezek alacsony LR-értékek, amelyek azt jelzik, hogy az állatkísérletek nagyon kis bizonyító erejűek az emberi toxicitás valószínűségére/nem toxicitására vonatkozóan. Rágcsálók, kutyák és majmok esetében is hasonlóan alacsony iNLR értékekről számolnak be, mint amit mi is találtunk. Röviden, sok tekintetben valójában megismétlik és megerősítik a mi megállapításainkat, összhangban a Módszereik 2.7. szakaszában tett kijelentésükkel, miszerint: “Általános szabályként egy teszt “diagnosztikusnak” tekinthető a pozitív kimenetel előrejelzésében, ha az LR+ >10, vagy a negatív kimenetel előrejelzésében, ha az iLR- > 10″. A 36 lehetséges eredményük közül csak két PLR/LR+ felelt meg a szerzők által elismert “diagnosztikus” definíciónak, azaz a > = 10 értéknek, és az iNLR/iLR- értékek egyike sem felelt meg ennek. Valójában az iLR- értékek közül 30 volt < =2, és ezek többsége egy vagy egy egység körül volt; azaz egyáltalán nem szolgáltak bizonyító erővel. Más szóval, az általuk idézett definíció és kritériumok szerint az állatkísérletek, adataik és elemzésük alapján, nem tekinthetők diagnosztikusnak/prediktívnek.

Méltányoljuk, hogy a szerzők elismerik a tudomány ezen területének néhány fontos pontját általában, valamint tanulmányuk néhány korlátját. Ahogy mi is tettük a saját munkánkban, ők is beszámolnak az állatkísérletek múltbeli értékének elemzésére irányuló “korlátozott” erőfeszítésekről, és elfogadják, hogy ezek “történelmi precedenseken” és egy értékfeltételezésen alapulnak. Elemzésükkel kapcsolatban elfogadják, hogy adataik mindössze 182 gyógyszerre vonatkoztak (szemben például a mi > 3200 gyógyszerünkkel); ők csak az állatkísérletek és az I. fázis egyezőségét vizsgálták, és nem vonták be a későbbi fázisú klinikai vizsgálatokat, amelyekben több gyógyszer sikertelen lesz. Tanulmányukban kevés, tág kategóriát használtak a mellékhatásokra (ADR), ami kedvez a hipotézisüknek a több és szigorúbb osztályozással szemben; és az egereket és a patkányokat “egy hatékony fajként” kombinálták, annak ellenére, hogy az egerek és a patkányok gyakran jelentős különbségeket mutatnak a toxicitásban . Végül, nem számoltak be összeférhetetlenségről, de köszönetet mondtak közel 20 biofarmáciai cégnek a köszönetnyilvánításban, és kilenc céggel állnak kapcsolatban. Bár nem feltételezünk semmiféle helytelenséget, egyesek azt állítják, hogy érdekük fűződhet ahhoz, hogy igazolják az iparáguk és a vállalatok történelmi és jelenlegi állatkísérleti felhasználását a gyógyszerkísérletek során.

Clark és Steger-Hartmann

Ez egy több mint 3000 gyógyszerre vonatkozó elemzés volt, az Elsevier átfogó PharmaPendium adatbázisának adatai alapján . A szerzők a miénkhez hasonló megközelítést alkalmaztak, azáltal, hogy LR-ek segítségével határozták meg az állatokon végzett tesztek diagnosztikus erejét a humán toxicitásról való tájékoztatáshoz, valamint arra a következtetésre jutottak, hogy tanulmányuk megerősítette a saját kiemelkedő megállapításunkat: “…úgy találták, hogy ezen események hiánya a nem klinikai vizsgálatokban nem jó előrejelzője az emberi biztonságosságnak, ezzel részben megerősítve Bailey és munkatársai (2014) megállapításait. “.

Kiemelkedő eredményünk megerősítése két okból is rendkívül fontos. Először is, bár nem kerestük saját megközelítésünk és publikációink validálását, hanem mindig is a legnagyobb bizalommal voltunk irántuk, egyes érdekeltek, akiknek ellentétes véleményük volt az állatokon végzett gyógyszerkísérletek értékéről, szándékosan becsmérelték munkánkat. Másodszor, függetlenül attól, hogy az állatkísérletek mennyire jól jelzik előre a humán toxicitást (hipotetikusan), az állatokban tapasztalt toxicitás hiánya a kritikus tényező egy új gyógyszer klinikai (humán) vizsgálatokba való továbblépése szempontjából. Amint azt továbbra is állítjuk, ha az állatkísérletek kudarcot vallanak ebben a döntő fontosságú tekintetben – és úgy tűnik, hogy így van -, az nem csak azt jelenti, hogy ezek a kísérletek nem alkalmasak az általános céljukra (biztonságos és hatékony humán gyógyszerek azonosítására), hanem ennek ki kell hatnia a gyógyszeriparra és szabályozó hatóságaira, valamint arra, hogy hogyan közelítik meg a gyógyszerkísérleteket általában.

Ez a tanulmány megerősítette másik fő megállapításunkat is, amely szerint az állatkísérletek során tapasztalt mellékhatások valójában valószínűleg embereken is előfordulnak (bár, ami fontos, gyakran nem hasonló módon). Döntő fontosságú azonban, hogy ennek a szempontnak a következményeit másképp értelmeztük. Mind a tanulmány szerzői, mind mi magunk úgy találtuk, hogy ez a szempont nagyon változó, és nincs egyértelmű minta a toxikus hatások típusai vagy a gyógyszerfajták tekintetében. Ezért arra a következtetésre jutottunk, hogy ez nem tekinthető különösen relevánsnak vagy megbízhatónak. Clark és Steger-Hartmann azonban hozott néhány példát arra, ahol az állatok valóban előre jelezték a humán toxicitást, de nem mutatták be, illetve nem mérlegelték azokat a területeket, ahol ez a prediktív szempont alacsonyabb, nem létező vagy negatív volt. Sőt, az általuk megadott példák némelyike csak alig haladta meg a saját maguk által meghatározott statisztikai küszöbértéket. Következésképpen úgy véljük, hogy míg mind az ő adataik, mind a mi adataink alátámasztják azt a következtetésüket, hogy “számos kulcsfontosságú megfigyelés állat-ember fordítása megerősítést nyert, mint előrejelző”, nem támasztják alá azt a következtetésüket, hogy tanulmányuk “…megerősítette az állati biztonsági megfigyelések általános előrejelző képességét az emberre vonatkozóan”. Ezt tetézik a nagyon rosszul előrejelző megfigyelések, amelyek csak súlyosnak tekinthetők, mint például a halál, a görcsök, a mozgászavarok és a májbetegségek.

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.