Az RNS szerkezete határozza meg a fehérjékkel való kölcsönhatást

júl 29, 2021
admin

A magasan strukturált RNS-ek nagy mennyiségű fehérjét kötnek meg

Azzal a céllal, hogy megvizsgáljuk, hogyan befolyásolja az RNS szerkezete a fehérjék kötődését, megmértük a kettős szálú régiók mennyiségét a humán transzkriptomban8 (1a. ábra). Először a “párhuzamos RNS-szerkezet-elemzéssel” (PARS)8 mért szerkezeti tartalom alapján csoportosítottuk a fokozott keresztkötéses és immunprecipitációs (eCLIP) megközelítéssel30 kimutatott RNS-eket osztályokba (Kiegészítő 1a. ábra és 1b. ábra). A PARS egy olyan kísérleti technika, amely két enzim, az RNáz V1 (amely képes kétszálú nukleotidokat vágni) és az S1 (amely képes egyszálú nukleotidokat vágni) katalitikus aktivitása alapján megkülönbözteti az RNS kettős- és egyszálú régióit, és amelynél a pozitív pontszámok kétszálú régiókat jeleznek (lásd Eq. (1) a Módszerek című fejezetben)8. Ezután a fehérje-RNS kölcsönhatásokra vonatkozó catRAPID előrejelzéseket használtuk (a proteom- és transzkriptom-szintű számításokat egyaránt tartalmazó RNAct adatbázisból31), és összehasonlítottuk a különböző csoportok kölcsönhatási pontszámát (HS, magas szerkezeti tartalom, vs. LS, alacsony szerkezeti tartalom) (1b. ábra). A catRAPID algoritmus32 mind a fehérje-, mind az RNS-szekvenciák (összesen 10 tulajdonság) van der Waals-, hidrogénkötési és szekunderszerkezeti hajlamain keresztül becsüli a kötődési potenciált (összesen 10 tulajdonság), lehetővé téve a kötőpartnerek nagy biztonsággal történő azonosítását. Valóban, amint arról egy nemrégiben végzett, mintegy félmillió kísérletileg validált kölcsönhatás31 elemzése során beszámoltak, az algoritmus képes a kölcsönhatásban lévő és a nem kölcsönhatásban lévő párokat 0,78-as receiver operating characteristic (ROC) görbe alatti területtel (AUC) elkülöníteni (a hamis felfedezési arány (FDR) jelentősen 0,25 alatt van, ha a Z-score értékek >2). A különböző szerkezeti tartalmú RNS-csoportok összehasonlítása következetes tendenciát mutat, miszerint az RNS-molekulák magasabb szerkezeti tartalma magasabb fehérjeinterakciós pontszámokat eredményez (1b. ábra). A PARS adatokkal kapcsolatban megjegyezzük, hogy a kettősszálú régiók mennyisége gyengén korrelál (<0,10; Pearson’s) az RNS hosszával és GC-tartalmával, ami arra utal, hogy ez a két tényező pozitívan járul hozzá a másodlagos szerkezethez, növelve a konformációs tér méretét, valamint az általános stabilitást33.

1. ábra
1. ábra

A fehérjeszerkezet mennyisége korrelál a kölcsönhatások számával. a Az összes humán RNS másodlagos szerkezetének a PARS (Parallel Analysis of RNA structure) segítségével mért másodlagos szerkezet tartalmának kumulatív eloszlásfüggvénye (CDF)8,69. A függőleges vonalak a legalacsonyabb szekundertartalmú (LS; kék) és a legmagasabb szekundertartalmú (HS; rózsaszín) RNS-ek bizonyos hányadát (X%) jelölik. b A humán RNS-ekkel való fehérje kölcsönhatások catRAPID előrejelzései a PARS által mért szerkezeti tartalom alapján rangsorolva (118 RNS-kötő fehérje (RBP), amelyekről szintén rendelkezésre áll a fokozott keresztkötési és immunprecipitációs (eCLIP) információ)31. A 10%, 15%, …, 50%-os frakciók az azonos méretű HS és LS halmazok összehasonlítására vonatkoznak. Az eredmények azt mutatják, hogy a catRAPID szignifikánsan és konzisztensen képes megkülönböztetni a HS és LS csoportokat a különböző frakciókon keresztül (p érték <10-16; Kolmogorov-Smirnov (KS) teszt). A dobozok az interkvartilis tartományt (IQR) mutatják, a középső vonal a mediánt, a whiskerek az IQR 1,5-szeresét adják hozzá a 75 percentilishez (doboz felső határa) és az IQR 1,5-szeresét vonják le a 25 percentilisből (doboz alsó határa). s.d. látható. c A fehérje kölcsönhatások száma (eCLIP) és a PARS30 által mért szerkezeti tartalom közötti kapcsolat. Az illeszkedő vonal megfelel az y = exp(α + βx) képletnek, ahol α = -0,75; β = 0,67; p-érték KS-teszttel becsülve. d A fehérje kölcsönhatások száma és a dimetil-szulfát-modifikációval (DMS)9 mért szerkezeti tartalom közötti kapcsolat. Az illeszkedő egyenes az y = 1/(α + βx) képletnek felel meg, ahol α = 2,60; β = 87,36; KS-teszttel becsült p-érték. e Az RBP-k három különböző CLIP-technikával (fotoaktiválható ribonukleoziddal megerősített CLIP (PAR-CLIP), nagy áteresztőképességű szekvenáló-CLIP (HITS-CLIP) és egyedi nukleotidfelbontású CLIP (iCLIP)) mért szerkezeti preferenciái. A szín az egyes fehérjék RNS-kötési preferenciáját jelzi: rózsaszín, magas struktúrájú; kék, alacsony struktúrájú; szürke, nincs preferencia. f Összefüggés nyolc transzkriptum szerkezeti tartalma (icSHAPE kísérletek CROSS predikciói) és a fehérje mikrotáblák által kimutatott fehérje kölcsönhatások között (Pearson korreláció). s.d. látható. g A Protein Data Bank (PDB) fehérje-RNS-komplexeket tartalmazó struktúráinak elemzése a fehérje (inter) és RNS (intra) kontaktusok közötti tendenciát mutatja (196 különböző pár; Pearson-féle korreláció)

Megismételtük az elemzést egy független megközelítéssel, az RPISeq-kel, amely a fehérje-RNS kölcsönhatásokat a nukleotid- és aminosav-szekvenciák szekvencia-mintázatai alapján jósolja meg11. Az RPISeq két, támogató vektorgépeken (RPISeq-SVM) és véletlen erdőn (RPISeq-RF) alapuló módszerből áll. A speciális számítási követelmények miatt a kötési valószínűségek becsléséhez az RPISeq-et az RBP-k egy együttesére (50 fehérje <0,85; http://cd-hit.org/ szekvencia-hasonlósággal) alkalmaztuk a szerkezeti tartalomeloszlás (100 transzkript) farokrészéből származó HS és LS készlet ellenében (Kiegészítő adatok 1). Mindkét esetben a HS készlet (RF 0,80, SVM 0,71) szignifikánsan nagyobb valószínűséggel kötődik, mint az LS készlet (RF 0,70, SVM 0,54; p érték <10-5; Kolmogorov-Smirnov (KS) teszt; Kiegészítő 1b-c ábra), összhangban a catRAPID elemzéssel (1b ábra). Elemzésünk tehát arra utal, hogy az RNS szerkezeti tartalma hatással van a fehérjékkel való kölcsönhatásra.

Az előrejelzéseinknek a kísérleti adatokkal való összevetése érdekében megvizsgáltuk az összes RBP-RNS kölcsönhatást, amelyet a fokozott keresztkötés és immunprecipitáció, eCLIP30 (118 RBP; lásd Módszerek) mutatott ki. Az eCLIP a cél-RNS-eken lévő fehérjekapcsolatokat egyedi nukleotid felbontásban, vonalkódolt egyszálú DNS-adapterek ligálásával biztosítja30. A catRAPID előrejelzésekkel31 összhangban (1b. ábra) az eCLIP kötési pontszámok korrelálnak a PARS másodlagos szerkezetével, ami azt jelzi, hogy az RNS-nek a fehérjékkel való kölcsönhatásra való hajlama arányos a transzkriptom széles körben mért szerkezet mennyiségével (1c. ábra). Megjegyezzük, hogy a CLIP-seq megközelítések általában az egyszálú (SS) RNS kimutatását részesítik előnyben a kétszálú (DS) RNS rovására34 , és az eCLIP-adatkészlet nem gazdagodik kétszálú RNS-kötő fehérjékben (118-ból 9-et az UniProt szerint dsRNS-kötőnek, 118-ból 12-t ssRNS-kötőnek rendeltek a rendelkezésre álló GO-annotációk35 alapján), ami azt jelzi, hogy eredményeinket nem torzítják az elemzésünkben használt fehérjetípusok.

Annak további megerősítésére, hogy a tendencia valódi, és nem csak a PARS-mérések sajátja, a teljes humán transzkriptom fehérje-interakciós potenciálját elemeztük a dimetil-szulfát-modifikációs (DMS) technikával mért RNS-szekunder struktúrával szemben (a PARS-től eltérően a magas értékek egyszálú régiókra utalnak; 1d. ábra)9. Az RNS-szerkezet értékelésének ez a módszere mélyszekvenálást alkalmaz a párosítatlan adenozin- és citidin-nukleotidok kimutatására. Az elemzés ismét azt mutatja, hogy a humán transzkriptumok RNS-szekunder szerkezete szoros korrelációban áll a fehérjekötő képességekkel.

A POSTAR-adatbázist (amely >1000 CLIP-seq-adatkészletet tartalmaz; http://lulab.life.tsinghua.edu.cn/postar/) arra is felhasználtuk, hogy visszakérdezzük a PAR-CLIP, a nagy áteresztőképességű szekvenáló-CLIP (HITS-CLIP) és az egyedi nukleotidfelbontású CLIP (iCLIP)10 segítségével mért humán fehérjék RNS-kötési preferenciáit (103 kísérlet, 85 különböző RBP). A CLIP-megközelítések (és más tényezők, például az alkalmazott sejtvonalak) belső különbségei miatt az egyes kísérletek eltérő fehérje-RNS kölcsönhatásokról számolnak be10. Mégis az RBP-k 77%-a legalább az egyik kísérleti módszer (DMS vagy PARS; 1e. ábra) esetében az erősen strukturált RNS-eket részesíti előnyben.

A nagy áteresztőképességű kísérletek lehetséges technikai torzításai miatt úgy döntöttünk, hogy a tendencia reprodukálhatóságát az RNS-szerkezet és a fehérje kölcsönhatások közötti korreláció vizsgálatával ellenőrizzük az alacsony áteresztőképességű elemzésekben. Először nyolc olyan nagy (>1000 nt) RNS interaktomját vizsgáltuk meg, amelyek fehérjepartnereit keresztkötésmentes megközelítéssel, microarray-vel21,36,37 azonosítottuk (lásd Módszerek). Ezzel párhuzamosan megbecsültük az egyes transzkriptek szerkezeti tartalmát a CROSS algoritmus segítségével, amelyet korábban SHAPE adatokon38 képeztünk ki, hogy nukleotid szintű felbontásban megjósoljuk a kétszálas hajlamot. Az 1f. ábrán bemutatott eredményeink azt mutatják, hogy az erősen strukturált transzkriptek több fehérjekapcsolattal rendelkeznek, mint a gyengén strukturált transzkriptek, ami teljes mértékben összeegyeztethető a korábbi elemzésünkben bemutatott eredményekkel (1b-e. ábra).

Megfigyeléseinket megerősítettük a Protein Data Bank (PDB) adatbázisában (röntgenfelbontás <2 Å; Kiegészítő adatok 2; lásd Módszerek) letétbe helyezett RNP-komplexek vizsgálatával, amely 196 különböző RNS-fehérje párost (>20 faj) tartalmaz, amelyeket különböző laboratóriumok különböző technikákkal (elsősorban röntgen- és nukleáris mágneses rezonancia (NMR) segítségével elemeztek. Az RNS-en belüli érintkezés (azaz az RNS-szerkezet mennyisége) és az interkontakt (azaz az aminosav) nukleotidlánconkénti mennyiségét mérve feltűnő, 0,78-as korrelációt találtunk a két változó között, ami meggyőzően bizonyítja szoros kapcsolatukat (1g. ábra; lásd a Módszerek (2) és (3) egyenleteit).

Függetlenül tehát a kísérlettől (PARS, DMS, microarray, röntgen, NMR, eCLIP, PAR-CLIP, HITS-CLIP és iCLIP), az alkalmazott algoritmustól (catRAPID és RPISeq vagy CROSS a SHAPE adatok utánzására) vagy a szervezettől (PDB adatbázis), korrelációt találtunk a fehérje kölcsönhatások száma és az RNS szerkezeti tartalma között.

Az RNS-típusok szerkezetvezérelt fehérjeinteraktivitása

A következőkben azt vizsgáltuk, hogy a szekunder szerkezet és a fehérjeinterakciók száma közötti szoros kapcsolat a specifikus RNS-típusok tulajdonsága-e (2a. ábra). Ennek érdekében a CD-HIT algoritmus39 (http://cd-hit.org/) segítségével összehasonlítottuk a szekvencia-hasonlóság alapján rangsorolt transzkriptek szekunder szerkezetét és fehérjeinterakcióit. A 85%-os hasonlósági küszöbértékkel 22 olyan klasztert találtunk (összesen 55 transzkript), amelyekben legalább egy RBP-kapcsolatot mutatott ki az eCLIP. Ezután kiszámítottuk a DMS jel és az eCLIP fehérje kölcsönhatások közötti korrelációt minden egyes klaszter esetében, és az esetek 64%-ában negatív korrelációt kaptunk. Ez az eredmény azt jelzi, hogy két hasonló transzkript között a nagyobb szerkezeti tartalommal rendelkező nagyobb valószínűséggel rendelkezik nagyobb számú fehérje kölcsönhatással.

2. ábra
2. ábra

Az RNS szerkezet által vezérelt fehérje kölcsönhatás funkcionális lábnyomai. a Az intra- és intermolekuláris kontaktusok szerepét bemutató séma egy RNS-fehérje komplexben. Fent, intramolekuláris kapcsolatok. Alul, molekulák közötti kapcsolatok. A kontaktusok számtartományát a sötétkéktől (legalacsonyabb) a pirosig (legmagasabb) terjedő árnyalatok jelzik. b Fent, szerkezeti tartalom (dimetil-szulfát-módosítás (DMS); p-érték KS-teszttel becsülve). Alul, Fehérje kölcsönhatások (fokozott keresztkötés és immunprecipitáció (eCLIP) a hemoglobin γ1 alegység (HBG1) (rózsaszín) és a hemoglobin γ2 alegység (HBG2) (kék) RNS-ek (99,3%-os szekvenciális azonosság); az empirikus p-értéket az eCLIP RNS-kötő fehérjékből (RBP) vett 1000 minta átfedésével való összehasonlítással becsültük. c A különböző RNS-típusok (Ensembl) RNS-struktúra (PARS) (rózsaszín) és DMS (kék) szerkezeti tartalmának párhuzamos elemzése. d A legkevésbé és leginkább strukturált RNS-ekhez (100 kevésbé strukturált (LS) vs. 100 magasan strukturált (HS) transzkript) kapcsolódó génontológiai kifejezések szemantikai csoportosítása a cleverGO segítségével. e Az egyes RNS-ek elemzésével (1. és 2b. ábra) azt találtuk, hogy a szerkezeti tartalom összefügg az RNS partnereinek számával és funkciójával. Elemzésünk azt mutatja, hogy a funkcionálisan rokon RNS-ek hasonló szerkezeti tartalommal rendelkeznek (2c. ábra). A szerkezet által vezérelt fehérjeinteraktivitás az RNS-hez kapcsolódó, bármely szabályozási szinten nyomon követhető belső tulajdonság. f Az egyes sorok egy-egy fizikai-kémiai tulajdonság eltávolításával okozott catRAPID kölcsönhatási hajlamokat mutatják13,32. Az α-hélix (Chou) és a polaritás (Grantham) eltávolítása csökkenti a HS és LS közötti különbségtétel képességét (p értékek KS teszttel becsülve). g Három RBP készlet és az UniProt-ban kettős szálú RNS-ek (DS) vagy egyszálú RNS-ek (SS) kötőjeként annotált fehérjék fizikai-kémiai tulajdonságainak multicleverMachine elemzése (lásd Módszerek). A “rendezetlenségi hajlam” és az “α-hélix” azok a tulajdonságok, amelyek legalább két RBP-adatbázis esetében szignifikáns különbséget és ellentétes eredményeket mutatnak a DS- és SS-kötők között (a kék vagy a rózsaszín azt jelzi, hogy a DS vagy az SS feldúsult vagy kimerült; a sárga azt jelzi, hogy nincs szignifikáns különbség a készletek között). A b, c ábrán a dobozok az interkvartilis tartományt (IQR) mutatják, a középső vonal a mediánt, a bevágások a medián 95%-os konfidenciaintervallumát, a whiskerek az IQR 1,5-szeresét adják hozzá a 75 percentilishez (doboz felső határa) és az IQR 1,5-szeresét vonják le a 25 percentilisből (doboz alsó határa). S.d. látható

A két legnagyobb hasonlóságot (99,31%) mutató transzkript a magzati májban, lépben és csontvelőben kifejeződő γ-globin HBG1 és HBG2 (γ1 és γ2 hemoglobin alegységek) (NCBI Gene ID: 3048). A magasabb struktúrájú γ-globin variáns (HBG1) szignifikánsan nagyobb számú fehérjeinteraktort tartalmaz (HBG1, átlagos DMS jel 0,04, 29 interaktor; HBG2, átlagos DMS jel 0,07, 14 interaktor; p érték = 0,003; KS teszt; 2b. ábra). Míg a két transzkriptum nukleotid-összetétele közel azonos (HBG1: 280c, 463c, 514t, 552a, 575g; HBG2: 280t, 463g, 514g, Δ552a, 574a), a HBG1 és HBG2 közötti különbségek azokra a régiókra koncentrálódnak, ahol a másodlagos szerkezet megváltozik (2. kiegészítő ábra). Ezek az eredmények azt jelzik, hogy a fehérje interaktivitása szorosan összefügg a másodlagos szerkezet elemeinek konformációs változásaival. Érdekes módon a HBG1 megnövekedett kettősszál-tartalma, különösen a 3′-UTR-ben, a transzlációt szabályozó elemek felhalmozódásával (2b. ábra) és az expresszió egyidejű csökkenésével jár együtt (NCBI Gene ID: 3048).

Ezután arra voltunk kíváncsiak, hogy specifikus RNS-struktúrák részt vesznek-e a fehérje szabályozásában. A humán transzkriptomot különböző osztályokra osztottuk, és elemeztük a másodlagos szerkezetüket, amelyet két független kísérleti technikával, a PARS és a DMS segítségével detektáltunk. Mindkét technika azt mutatja, hogy a fehérjekódoló RNS-ek rendelkeznek a legnagyobb szerkezeti tartalommal (2c. ábra, 1. kiegészítő táblázat)38 . Bár az mRNS szerkezetének egy része az UTR-ekben koncentrálódik8 , ha ezeket kizárjuk, a szerkezeti tartalom eloszlása nem változik lényegesen (Pearson-féle korreláció az UTR-ekkel és az UTR nélküli transzkriptek között = 0,94; 3. kiegészítő ábra). A fehérjékkel kölcsönhatásban lévő ismert RNS-ek, mint például a kis nukleáris RNS-ek (snRNS-ek)40 és a kis nukleoláris RNS-ek (snoRNS-ek)28 mutatják a legnagyobb mennyiségű struktúrát, míg a nukleinsavak komplementer régióit célzó RNS-ek, mint például az antisense, a miRNS-ek és számos hosszú intergenikus nem kódoló RNS (lincRNS)41,42 rendelkeznek a legkisebb mennyiségű struktúrával43 (1. kiegészítő táblázat).

Eredményeinkkel összhangban Seemann et al.12 korábban szoros kapcsolatot figyeltek meg az mRNS-ekben a fehérjekötés és a szerkezeti elemek konzerválódása között, amelyek a hosszú nem kódoló RNS-ekben kisebb mértékben fordulnak elő12. Bár a lincRNS-ek kisebb mennyiségű kettősszálú régiót mutatnak (legalacsonyabb a PARS-ben, harmadik legalacsonyabb a DMS-ben), megjegyezzük, hogy néhányuk, mint például a NEAT144 és a XIST27, strukturált doméneken keresztül képes a fehérjék összeszerelődésének megalapozására. Mivel folyamatos vita folyik a kódoló és nem kódoló transzkriptek közötti strukturális különbségekről45,46 , és a DMS és PARS adatok elemzése ellentmondó eredményeket mutat egyes RNS-típusok esetében, további vizsgálatokat javasolunk a jövőbeli tanulmányokban (2c. ábra; 1. kiegészítő táblázat).

Az erősen és gyengén strukturált RNS-ek közötti funkcionális különbségek vizsgálatához a legkevésbé és a leginkább strukturált RNS-ekhez (100 LS vs. 100 HS transzkript) kapcsolódó GO-terminusokat elemeztük a cleverGO35 megközelítéssel. Míg az LS-halmaz (14 nem-kódoló RNS és 86 mRNS) nem társul specifikus szemantikai hasonlósági klaszterekhez (összesen 36 kifejezés p-értékkel <0,05; Bonferroni-teszt), addig a HS-halmaz (100 mRNS; összesen 395 kifejezés p-értékkel <0,05 és 103 kifejezés p-értékkel <0,01; Bonferroni-teszt; 2d. ábra) 20 különböző klasztert tartalmaz. A klaszterekhez kapcsolódó és a bejegyzések legalább egynegyedét lefedő öt fő kategória a következő: (i) komplex fehérje szabályozás (49/103), (ii) nukleozid metabolikus folyamat (39/103), (iii) sejtválasz (29/103), (iv) génexpresszió (29/103) és (v) fehérjecélzás (28/103). A GO-terminuselemzést megismételtük a 25%-kal magasabb expressziójú transzkriptek háttérként való felhasználásával is, és hasonló eredményeket kaptunk (K562 törzs GENCODE, Módszerek, 4. kiegészítő ábra).

A klaszterelemzés azt az érdekes megállapítást tárja fel, hogy az erős szerkezeti tartalommal rendelkező transzkriptek nagyobb mértékben lépnek kölcsönhatásba polipeptidekkel, és olyan fehérjéket kódolnak, amelyek szabályozó funkciókban és komplex kapcsolathálózatok kialakításában vesznek részt. Tekintettel az RNS-szerkezet és a fehérje kölcsönhatások száma közötti összefüggésre (1. ábra), eredményeink egyik előzetes értelmezése az, hogy nagyszámú sejthálózat aktivitását koordináló gének esetében nagyfokú szabályozásra van szükség47. Elemzésünk tehát egy “rekurzív” tulajdonságra utal: a nagymértékben érintkező transzkriptek nagymértékben érintkező fehérjéket kódolnak (2e. ábra)20,48.

A rendezetlenség és a hélix megkülönbözteti a dsRNS-t az ssRNS-től

Az RNS-molekulák szerkezetvezérelt interaktivitásának molekuláris alapjainak megértéséhez elemeztük, hogy a fehérjék mely fizikai-kémiai tulajdonságai különböztetik meg jobban a HS és LS halmazokat. Megvizsgáltuk mind a 10, a catRAPID algoritmusban használt változót (2f. ábra)13,32 és egyenként eltávolítottuk őket, hogy megbecsüljük az RNS-fehérje kölcsönhatások előrejelzésére gyakorolt hatásukat. Azt találtuk, hogy a legkevésbé és a leginkább strukturált RNS-ek (100 HS és LS transzkriptum; Kiegészítő adatok 3) halmazok megkülönböztetésének képességét jobban befolyásolja a polaritás (p-érték = 0,28; KS-teszt) és az α-hélix hajlam (p-érték = 0,06; KS-teszt) eltávolítása (2f. ábra). A HS-kötési hajlamot szignifikánsabban befolyásoló tulajdonság a polaritás, amely a szerkezetileg rendezetlen fehérjékben49 feldúsul, és antikorrelál a makromolekuláris felismerésben kulcsfontosságú hidrofobicitással (2. kiegészítő táblázat)50 . Ami az α-hélix hajlamot illeti, megjegyezzük, hogy a hélixek a leggyakoribb szerkezeti elemek, amelyek részt vesznek a kettősszálú régiókkal való kapcsolat kialakításában, és előfordulnak a dsRBD-kben és a cinkujjakban29 (3. kiegészítő táblázat). Megfigyelésünk a fehérjék és az RNS-ek közötti lehetséges koevolúcióra utal: míg az RNS komplex formákat vesz fel a kötő régiók feltárása érdekében, a fehérjék megváltoztatják szerkezeti tartalmukat. A kulcszár-elmélettel51 összhangban azt javasoljuk, hogy a természetes szelekció az erősen strukturált RBP-ket részesíti előnyben a dsRNS-ek interaktoraiként.

A fehérjék polaritásának és helikális szerkezetének fontosságát a jól vizsgált RBP-k három adathalmazának (humán és élesztő)52,53,54 és az UniProt-ból (minden élőlény) visszakeresett két fehérjecsoportnak a kizárólag ssRNS-kötő (453 fehérje) vagy dsRNS-kötő (390 fehérje; Kiegészítő adatok 4) összehasonlításával igazoltuk. A biofizikai tulajdonságok elemzése a cleverMachine megközelítéssel55 kimutatta, hogy az ssRNS-kötők és a dsRNS-kötők két tulajdonság tekintetében különböznek egymástól: a rendezetlenség és az α-hélix-tartalom tekintetében (2g. ábra). A két halmaz egymással való összehasonlítása azt mutatja, hogy az erősen strukturált RNS-ekkel kölcsönhatásba lépő RBP-k strukturáltak és hidrofóbok, míg a rendezetlen és poláris RBP-k kevésbé strukturált RNS-ekkel társulnak (5. kiegészítő ábra). Így elemzésünk tovább bővíti azt, amit korábban a fehérje-fehérje kölcsönhatási hálózatokra vonatkozóan jelentettek, amelyekben a strukturális rendezetlen régiókról kimutatták, hogy központi szerepet játszanak47 , és új szabályokat javasol a nukleotid bázispárosodásra az aminosavakkal.

RNS-szerkezet tartalma és fehérjekapcsolat a chaperonokban

A humán transzkriptom és a különböző organizmusok elemzése arra utal, hogy az erősen strukturált RNS-ek hajlamosak a polipeptidekkel való kölcsönhatásra, és viszont olyan fehérjéket kódolnak, amelyek nagy és összetett kapcsolathálózatokkal járó biológiai folyamatokban vesznek részt. Az RNS-molekulák szerkezetvezérelt fehérjeinteraktivitásának jobb vizsgálata érdekében a több partnerrel kölcsönhatásba lépő fehérjéket kódoló transzkriptek egy osztályára összpontosítottunk. Az elemzéshez természetes választásnak bizonyultak a molekuláris chaperonok, mivel elősegítik a natív állapotba történő hajtogatást56 és szervezik a fázisszeparált RNP-összeállítást57 , így teljesítik a 2d. ábrán bemutatott “rekurzív” tulajdonságot. Az eCLIP-adatok30 azt mutatják, hogy a humán chaperonokat kódoló RNS-ek többsége több fehérjével való kölcsönhatásban vesz részt (6. kiegészítő ábra). Szignifikáns korrelációt találtunk a BioGRID-ben annotált fehérje-RNS és fehérje-fehérje kölcsönhatások között (3a. ábra). Ez az eredmény megerősíti, hogy a sok RBP által kötött transzkriptumok egyben magas kontaktusú fehérjéket is kódolnak.

3. ábra
3. ábra

Reláció az RNS szerkezet és a chaperonok fehérjekapcsolatai között. a A fehérje chaperonokat kódoló RNS-ek fokozott keresztkötéssel és immunprecipitációval (eCLIP)30 mért kontaktusai és a megfelelő kódolt fehérjék fizikai kölcsönhatásai, amelyeket a BioGRID-ből gyűjtöttek; p érték KS-teszttel becsülve. b Az RNS szerkezet párhuzamos elemzése (PARS) szerkezeti tartalma és a kódolt fehérjék fizikai kölcsönhatásai közötti összehasonlítás a BioGRID-ből gyűjtött, a teljes transzkriptomra. A transzkriptomot öt egymást követő, a transzkriptom egyenként 20%-át tartalmazó készletre osztottuk. A készleteket PARS szerkezeti tartalmuk alapján választottuk ki, az egyes készletek tartománya balról jobbra a következő: -10,7 és -4,6 között; -4,6 és -3,1 között; -3,1 és -2,4 között; -2,4 és -1,9 között; -1,9 és -0,5 között. Az utolsó boxplot a BioGRID-ból visszakeresett fizikai interaktorok számának eloszlását mutatja a chaperon fehérjecsalád (hősokkfehérjék) esetében. c A HS (HSP70, rózsaszín) és LS (BRaf, kék) transzkriptumok másodlagos szerkezetének PARS mérése. A függőleges szaggatott vonalak a nem transzlált régiókat (UTR) jelölik. d A HS és LS transzkriptek PARS másodlagos szerkezeti tartalma (p érték KS teszttel becsülve). e Venn-diagram, amely a HS és LS RNS-ek eCLIP-pel mért fehérjeinterakcióinak átfedését mutatja (empirikus p-érték <6 × 10-3; az eCLIP RBP-kből vett 1000 átfedés eloszlásával való összehasonlítással becsülve). f A HS és LS RNS-ek fehérjekötési hajlandóságának előrejelzése a catRAPID13,32 segítségével (KS-teszttel becsült p-érték). A b, d, f esetében a dobozok az interkvartilis tartományt (IQR) mutatják, a középső vonal a mediánt, a bevágások a medián 95%-os konfidenciaintervallumát, a whiskerek az IQR 1,5-szeresét adják hozzá a 75 percentilishez (doboz felső határa) és az IQR 1,5-szeresét vonják le a 25 percentilisből (doboz alsó határa). S.d. látható

Hogy megértsük, hogy a fehérje-fehérje és a fehérje-RNS kölcsönhatások közötti korreláció általános tulajdonság-e vagy egyszerűen a chaperoncsalád jellemzője, elemeztük a PARS-pontszámok alapján rangsorolt transzkriptom és 24 olyan, chaperonokat kódoló mRNS kölcsönhatásait, amelyekről PARS-adatok állnak rendelkezésre (Genecards; https://www.genecards.org; “HSPs” készlet; Módszerek, 3b. ábra). Pozitív korrelációt találtunk az RNS-struktúra mennyisége és a kódolt fehérjék BioGRID interaktorainak száma között (7a-b. kiegészítő ábra). Így számításaink összhangban vannak a GO-elemzéssel (2d. ábra), és az mRNS-ek és kódoló partnereik közötti kapcsolatra utalnak: a nagy szerkezetű RNS-ek nagy kölcsönhatású fehérjéket kódolnak.

Az eddig bemutatott adatok arra utalnak, hogy a típus (pl. miRNS, snRNS) vagy funkció (pl. chaperonokat kódoló) szerint rokon RNS-ek hasonló szerkezeti jellemzőkkel rendelkeznek (2. ábra). Így két, egymással nem rokon transzkriptum kölcsönhatási hálózatának különbségeit a szerkezeti tartalmuk elemzésével kellene megbecsülni, és fordítva. E hipotézis teszteléséhez kiválasztottuk az erősen strukturált HSP70 transzkriptet (HS RNS, a PARS pontszám -1,3 logaritmusa 26%-os kettősszál-tartalomnak felel meg, 3c. ábra), amely egy olyan chaperont kódol, amely elengedhetetlen az olyan fehérjekomplex-összeállások szabályozásához, mint a klatrinburok58 és a stresszgranulumok22,57 . Kontrollként a BRaf-ot kódoló RNS-t választottuk, amely kevésbé strukturált (LS RNS, pontszám -2,8, ami a PARS szerint 6%-os kettősszál-tartalmat jelez, 3c-e ábra) és egy olyan onkogént kódol, amely a sejten kívüli kémiai jelek sejtmagba történő továbbításában vesz részt (a strukturális összehasonlítást a CROSS előrejelzések és a DMS-kísérletek is megerősítik, amint azt a kiegészítő ábra mutatja. 8. ábra).

Megállapítottuk, hogy a HSP70-nek nagyobb számú partnere van (30 eCLIP által azonosított RBP), mint a BRaf-nak (9 eCLIP RBP, 6 közös a HSP70-vel, 9. kiegészítő ábra), ami tökéletesen összhangban van a fehérjék szerkezetvezérelt interaktivitási tulajdonságával. Az 1b. ábra tendenciájával összhangban a catRAPID azt jelzi, hogy a fehérjék nagyobb hajlamot mutatnak a HSP70-hez való kötődésre, mint a BRaf-hoz (3f. ábra). Ráadásul az erősen strukturált HSP70 egy nagyobb számú interaktort tartalmazó fehérjét kódol (244 BioGRID fizikai interaktort), míg a rosszul strukturált BRaf egy kisebb számú molekulához (88 BioGRID fizikai interaktor) kötődő fehérjetermékkel rendelkezik. Megfigyeléseink arra utalnak, hogy egy nagy számú interakcióval rendelkező RNS hajlamos arra, hogy hálózati regulátorként működjön: feltételezzük, hogy a nagyobb interaktivitás miatt a HSP70 transzkript a kontextustól függően chaperonként működhet.

Ezért feltételezzük, hogy egy strukturált RNS a nagyobb fehérje-interakciós potenciálja miatt jobban képes befolyásolni a fehérje interakciós hálózatot, mint egy rosszul strukturált RNS. Egy proof-of-concept kísérletben egy kémiai vegyületet, biotinilált izoxazolt (b-isox) használtunk arra, hogy folyékony-szilárd fázisú átmenet kialakulását idézzük elő egy fehérjeegyüttesben59,60 , amelyet HS (HSP70) vagy LS (BRaf) transzkriptumokkal inkubáltunk (4a. ábra és 10. kiegészítő ábra). Megfigyeltük, hogy a HS jobban megváltoztatta a fehérjeaggregátum összetételét, mint az LS RNS (4b. ábra és 5. kiegészítő adat). Valóban, amikor HS RNS-t adtunk hozzá, 29 fehérje koncentrációjának szignifikáns változását figyeltük meg (4c. ábra; 21 “felszabadult” halmaz, fekete pontok, és 8 “megtartott” halmaz, piros pontok a 4b. ábrán), míg az LS RNS esetében csak kilenc fehérjét azonosítottunk. Így az összetétel LS RNS jelenlétében hasonló maradt a háttérkontrollhoz (“statikus” készlet, szürke pontok a 4b. ábrán).

4. ábra
4. ábra

A strukturált RNS csökkenti a fehérjeaggregációt in vitro. a HeLa fehérje lizátum biotinilált izoxazol (b-isox)-vezérelt aggregációja in vitro. Balra, Coomassie-festett gélek, egy reprezentatív kísérlet látható (a vágatlan gélek a 10. kiegészítő ábrán láthatók). Középen, az aggregált fehérje intenzitását számszerűsítettük, és a különbséget kétfarkú t-próbával értékeltük (p = 1 ×1 0-3; N = 3 biológiai ismétlés, a képen pontokként ábrázolva). S.d. látható. Jobbra, kísérleti séma. Az aggregáció hatékonyságát a kapott csapadék b-isox jelenlétében vagy hiányában történő összehasonlításával vizsgáltuk, ezt a+ vagy a- jelzi, értelemszerűen. b Volcano plotok mutatják az egyes fehérjék b-isox összeszerelésben való feldúsulásának p értékeit (Perseus mérés) (N = 4 független biológiai ismétlés). A statisztikai szignifikancia küszöböt vízszintes vonal jelöli (lásd még Kiegészítő adatok 5). A fekete pontok azok a fehérjék, amelyek koncentrációja szignifikánsan csökkent az RNS-inkubációt követően. A piros pontok azok a fehérjék, amelyek koncentrációja az RNS inkubáció után szignifikánsan megnövekedett. c A magas szerkezetű (HS) RNS által befolyásolt fehérjék színkódolt jelölésmentes kvantitációs (LFQ) intenzitásai a fekete (alacsony) és a piros (magas) skálán. A Perseus által végzett hierarchikus klaszterezés feltüntetve. Az összehasonlítás érdekében ugyanezen fehérjék LFQ-intenzitását kontrollban és LS RNS jelenlétében is ábrázoltuk

Azt gondoltuk, hogy az RNS-nek a b-izox csapadék kontaktushálózattal59,60 való versengése akár közvetlen, akár közvetett fehérje-RNS kölcsönhatások eredménye lehet (5a. ábra). A catRAPID előrejelzések mégis a közvetlen hatás hipotézisét támasztják alá: a kísérleti szigor növekedése (11. kiegészítő ábra; Módszerek) az elméleti előrejelző képesség növekedésével is együtt jár (5b. ábra). Az RNS-kötési preferenciák korábbi elemzésével összhangban a HSP70 inkubáció hatására felszabaduló fehérjék szignifikánsan polaritástól megfosztott eredményt adnak (5c. ábra). Kísérletünk tehát arra utal, hogy az RNS-molekulák szerkezetvezérelt fehérje-interaktivitása minden szinten aktív, elősegítve az egyes kölcsönhatásokat és megváltoztatva a kondenzátumok összetételét12 (2e. ábra).

Ábra. 5
ábra5

Interakciók a ribonukleoprotein-kondenzátumon belül. a A fehérjék felszabadulása a biotinilált izoxazol (b-isox) összeállításból a következők eredménye lehet: (1) egy közvetett folyamat, amely az RNS és a fehérjeaggregátum közötti kölcsönhatási versenyből ered, vagy (2) egy közvetlen folyamat, amely a fehérjék RNS általi szekvenciójából ered. A b catRAPID teljesítménye javul a b-isox kísérletek szigorával (Módszerek), ami a magas szerkezetű (HS) RNS által megmentett fehérjék közvetlen toborzására utal. A hamis felfedezési arány (FDR) a legszigorúbb kísérleti készlet esetében (FDR = 0,1) nagyon szignifikánssá válik. c A “felszabadított” fehérjék (fekete doboz) kevésbé polárisak, mint a “statikus” fehérjék (szürke doboz), összhangban a számítógépes elemzésünkkel (p-érték = 4,7 × 10-2, KS-teszttel becsült p-érték; lásd még a 2f, g ábrát). A felszabadult és statikus fehérjék megfelelnek a 4b. ábra jobb oldali panel fekete és szürke pontjainak. A dobozok az interkvartilis tartományt (IQR) mutatják, a középső vonal a mediánt, a rovátkák a medián 95%-os konfidenciaintervallumát, a whiskerek az IQR 1,5-szeresét adják hozzá a 75 percentilishez (doboz felső határa) és az IQR 1,5-szeresét vonják le a 25 percentilisből (doboz alsó határa). S.d. látható

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.