RNA structure drives interaction with proteins

jul 29, 2021
admin

Hoog gestructureerde RNA’s binden een groot aantal eiwitten

Om te bestuderen hoe de RNA-structuur de eiwitbinding beïnvloedt, hebben we de hoeveelheid dubbelstrengs regio’s van het menselijk transcriptoom gemeten8 (Fig. 1a). We groepeerden eerst de RNA’s, zoals gedetecteerd door enhanced crosslinking en immunoprecipitatie (eCLIP) benadering30, in klassen op basis van de structurele inhoud gemeten door ‘parallelle analyse van RNA structuur’ (PARS)8 (Supplementary Fig. 1a en Fig. 1b). PARS is een experimentele techniek die een onderscheid maakt tussen dubbelstrengs en enkelstrengs regio’s van RNA aan de hand van de katalytische activiteit van twee enzymen, RNase V1 (in staat om dubbelstrengs nucleotiden te snijden) en S1 (in staat om enkelstrengs nucleotiden te snijden) en waarbij positieve scores dubbelstrengs regio’s aangeven (zie Eq. (1) in Methods)8. Vervolgens gebruikten we catRAPID voorspellingen van eiwit-RNA interacties (beschikbaar uit de RNAct database die zowel proteoom-brede als transcriptoom-brede berekeningen bevat31) en vergeleken de interactiescores van verschillende groepen (HS, hoog structureel gehalte, versus LS, laag structureel gehalte) (Fig. 1b). Het catRAPID algoritme32 schat het bindingspotentieel door van der Waals, waterstofbruggen en secundaire structuur neigingen van zowel eiwit en RNA sequenties (totaal van 10 eigenschappen), waardoor identificatie van bindende partners met een hoge betrouwbaarheid. Inderdaad, zoals gerapporteerd in een recente analyse van ongeveer een half miljoen experimenteel gevalideerde interacties 31, het algoritme is in staat om interacterende vs niet-interacterende paren scheiden met een oppervlakte onder de curve (AUC) receiver operating characteristic (ROC) curve van 0,78 (met false discovery rate (FDR) aanzienlijk lager dan 0,25 wanneer de Z-score waarden zijn >2). Vergelijking van RNA-groepen met verschillende structurele inhoud toont een consistente trend waarin een hogere structurele inhoud in RNA-moleculen resulteert in hogere eiwit-interactie scores (Fig. 1b). Wat de PARS-gegevens betreft, merken we op dat de hoeveelheid dubbelstrengsregio’s zwak correleert (<0,10; Pearson’s) met de RNA-lengte en het GC-gehalte, wat erop wijst dat deze twee factoren een positieve bijdrage leveren aan de secundaire structuur door de omvang van de conformationele ruimte te vergroten, evenals de algehele stabiliteit33.

Fig. 1
figure1

De hoeveelheid eiwitstructuur correleert met het aantal interacties. a Cumulatieve verdelingsfunctie (CDF) voor het secundaire-structuurgehalte van alle menselijke RNA’s, gemeten met parallelle analyse van de RNA-structuur (PARS)8,69. Verticale lijnen geven een bepaalde fractie (X%) aan van RNA’s met het laagste secundaire gehalte (LS; blauw) en dezelfde fractie met het hoogste secundaire gehalte (HS; roze). b catRAPID-voorspellingen van eiwitinteracties met menselijke RNA’s, gerangschikt volgens het met PARS gemeten structuurgehalte (118 RNA-bindende proteïnen (RBP’s) waarvoor ook verbeterde crosslinking- en immunoprecipitatie (eCLIP)-informatie beschikbaar is)31. De fracties 10%, 15%, …, 50% verwijzen naar de vergelijking tussen HS- en LS-reeksen van gelijke grootte. De resultaten geven aan dat catRAPID in staat is om HS en LS groepen significant en consistent te onderscheiden door de verschillende fracties (p waarde <10-16; Kolmogorov-Smirnov (KS) test). De boxen geven de interkwartielafstand (IQR) weer, de centrale lijn geeft de mediaan weer, de whiskers tellen 1,5 maal de IQR op bij het 75-percentiel (bovengrens box) en trekken 1,5 maal de IQR af van het 25-percentiel (ondergrens box). s.d. wordt weergegeven. c Verband tussen aantal eiwitinteracties (eCLIP) en structurele inhoud gemeten door PARS30. De fittinglijn komt overeen met de formule y = exp(α + βx), waarbij α = -0,75; β = 0,67; p-waarde geschat met KS-test. d Verband tussen aantal eiwitinteracties en structurele inhoud gemeten door dimethylsulfaatmodificatie (DMS)9. De fittinglijn komt overeen met de formule y = 1/(α + βx), waarbij α = 2,60; β = 87,36; p-waarde geschat met KS-test. e Structurele voorkeuren van RBP’s gemeten met drie verschillende CLIP-technieken (foto-activeerbare ribonucleoside-enhanced CLIP (PAR-CLIP), high-throughput sequencing-CLIP (HITS-CLIP) en individuele nucleotidenresolutie-CLIP (iCLIP)). De kleur geeft de RNA-bindende voorkeur van elk eiwit aan: roze, hoog gestructureerd; blauw, laag gestructureerd; grijs, geen voorkeur. f Correlatie tussen structurele inhoud (CROSS-voorspellingen van icSHAPE-experimenten) en eiwitinteracties van acht transcripten, aangetoond door eiwitmicroarrays (Pearson’s correlatie). s.d. wordt getoond. g Analyse van Protein Data Bank (PDB) structuren die eiwit-RNA complexen onthult een trend tussen eiwit (inter) en RNA (intra) contacten (196 verschillende paren; Pearson’s correlatie)

We herhaalden de analyse met een niet-verwante benadering, RPISeq, die eiwit-RNA interacties voorspelt met behulp van sequentiepatronen in nucleotide en aminozuursequenties11. RPISeq bestaat uit twee methoden op basis van support vector machines (RPISeq-SVM) en random forest (RPISeq-RF). Vanwege specifieke computationele vereisten hebben we RPISeq toegepast op een ensemble van RBP’s (50 eiwitten met sequentiegelijkenis <0,85; http://cd-hit.org/) tegen de HS en LS set uit de staarten van de structurele inhoudsverdeling (100 transcripten) om de bindingswaarschijnlijkheden te schatten (Supplementary Data 1). In beide gevallen wordt voorspeld dat de HS set (RF 0.80, SVM 0.71) bindt met significant hogere waarschijnlijkheid dan de LS set (RF 0.70, SVM 0.54; p waarde <10-5; Kolmogorov-Smirnov (KS) test; Supplementary Fig. 1b-c), in overeenstemming met de catRAPID analyse (Fig. 1b). Onze analyse suggereert dus dat de RNA-structuurinhoud van invloed is op de interactie met eiwitten.

Om onze voorspellingen met experimentele gegevens in overeenstemming te brengen, onderzochten we alle RBP-RNA-interacties die met enhanced CrossLinking and ImmunoPrecipitation, eCLIP30 (118 RBP’s; zie Methoden) werden onthuld. eCLIP levert eiwitcontacten op doel-RNA’s bij individuele nucleotideresolutie door ligatie van gebarcodeerde single-stranded DNA-adapters30. In overeenstemming met catRAPID voorspellingen31 (Fig. 1b), eCLIP binding scores correleren met PARS secundaire structuur, wat aangeeft dat de RNA neiging tot interactie met eiwitten is evenredig met de hoeveelheid structuur gemeten transcriptoom breed (Fig. 1c). Wij merken op dat de CLIP-seq benaderingen in het algemeen detectie van enkelstrengs (SS) RNA ten koste van dubbelstrengs (DS) RNA34 en de eCLIP dataset is niet verrijkt in dubbelstrengs RNA-bindende eiwitten (9 van de 118 worden toegewezen volgens UniProt als dsRNA binding, 12 van de 118 als ssRNA binding, met behulp van beschikbare GO annotaties35), wat aangeeft dat onze resultaten niet worden vertekend door de eiwittypes gebruikt in onze analyse.

Om verder te bevestigen dat de trend echt is en niet alleen inherent aan PARS-metingen, analyseerden we het eiwit-interacterende potentieel van het hele menselijke transcriptoom tegen de secundaire structuur van RNA gemeten met de dimethylsulfaat modificatie (DMS) techniek (anders dan PARS, hoge waarden wijzen op enkelstrengs regio’s; Fig. 1d)9. Deze methode voor de beoordeling van de RNA-structuur maakt gebruik van deep sequencing om ongepaarde adenosine en cytidine nucleotiden op te sporen. Nogmaals, de analyse toont aan dat de RNA secundaire structuur van de menselijke transcripten is nauw gecorreleerd met eiwit-bindende capaciteiten.

We gebruikten ook de POSTAR database (met >1000 CLIP-seq datasets; http://lulab.life.tsinghua.edu.cn/postar/) om de RNA-bindende voorkeuren van menselijke eiwitten (103 experimenten, 85 verschillende RBP’s) gemeten met PAR-CLIP, high-throughput sequencing-CLIP (HITS-CLIP) en individuele nucleotide resolutie CLIP (iCLIP)10 op te halen. Door intrinsieke verschillen in de CLIP-benaderingen (en andere factoren, zoals de gebruikte cellijnen), rapporteert elk experiment verschillende eiwit-RNA interacties10. Toch 77% van de RBP’s hebben voorkeur voor zeer gestructureerde RNA’s voor ten minste een van de experimentele methoden (DMS of PARS; Fig. 1e).

Gezien mogelijke technische vertekeningen van high-throughput experimenten, hebben we besloten om de reproduceerbaarheid van de trend te controleren door het onderzoeken van de correlatie tussen RNA-structuur en eiwit interacties in low-throughput analyses. We bestudeerden eerst het interactoom van acht grote (>1000 nt) RNA’s waarvan de eiwitpartners zijn geïdentificeerd door microarray, een crosslinking-vrije benadering21,36,37 (zie Methoden). Parallel daaraan hebben we de structurele inhoud van elk transcript geschat met behulp van het CROSS-algoritme dat eerder was getraind op SHAPE-gegevens38 om de dubbelstrengs neiging op nucleotideniveau resolutie te voorspellen. Onze resultaten in Fig. 1f geven aan dat sterk gestructureerde transcripten meer eiwitcontacten hebben dan slecht gestructureerde transcripten, wat volledig compatibel is met de bevindingen van onze vorige analyse (Fig. 1b-e).

We bevestigden onze waarnemingen door de studie van RNP-complexen gedeponeerd in de Protein Data Bank (PDB) database (röntgenstralen resolutie <2 Å; Supplementary Data 2; zie Methoden), die bestaat uit 196 verschillende RNA-eiwit paren (>20 soorten) geanalyseerd met verschillende technieken (voornamelijk röntgenstralen en nucleaire magnetische resonantie (NMR)) door verschillende laboratoria. Het meten van de hoeveelheid RNA intra-contact (dat wil zeggen de hoeveelheid RNA-structuur) en inter-contact (dat wil zeggen aminozuur) per nucleotideketen, vonden we een opvallende correlatie van 0,78 tussen de twee variabelen, die overtuigend bewijs levert van hun nauwe relatie (Fig. 1g; zie Eqs. (2) en (3) in Methods).

Dus onafhankelijk van het experiment (PARS, DMS, microarray, X-ray, NMR, eCLIP, PAR-CLIP, HITS-CLIP en iCLIP), de gebruikte algoritmen (catRAPID en RPISeq of CROSS om SHAPE-gegevens na te bootsen) of organisme (PDB-database), vonden we een correlatie tussen het aantal eiwitinteracties en RNA structurele inhoud.

De structuur-gedreven eiwitinteractiviteit van RNA-types

Wij onderzochten vervolgens of het nauwe verband tussen secundaire structuur en aantal eiwitinteracties een eigenschap is van specifieke RNA-types (Fig. 2a). Daartoe vergeleken we de secundaire structuur en eiwitinteracties van transcripten gerangschikt op sequentiegelijkenis met behulp van het CD-HIT algoritme39 (http://cd-hit.org/). Met een drempel van 85% overeenkomst, vonden we 22 clusters (totaal 55 transcripten) met ten minste één RBP contact geopenbaard door eCLIP. Vervolgens berekenden we de correlatie tussen DMS signaal en eCLIP eiwit interacties voor elke cluster en verkregen een negatieve correlatie in 64% van de gevallen. Deze bevinding wijst erop dat tussen twee vergelijkbare transcripten het transcript met het hoogste structurele gehalte meer kans heeft op een groter aantal eiwitinteracties.

Fig. 2
figure2

Functionele voetafdrukken van de door de RNA-structuur gestuurde eiwitinteractiviteit. a Schema dat de rol van intra- en intermoleculaire contacten in een RNA-eiwitcomplex laat zien. Boven, intramoleculaire contacten. Onder, inter-moleculaire contacten. Het aantal contacten wordt aangegeven met tinten van donkerblauw (laagste) tot rood (hoogste). b Boven, Structurele inhoud (dimethylsulfaat modificatie (DMS); p waarde geschat met KS test). Onder, Eiwit interacties (verbeterde CrossLinking en ImmunoPrecipitatie (eCLIP) van hemoglobine subeenheid γ1 (HBG1) (roze) en hemoglobine subeenheid γ2 (HBG2) (blauw) RNA’s (99,3% van de sequentiële identiteit); de empirische p waarde werd geschat door vergelijking van de overlap met die van 1000 monsters genomen van eCLIP RNA-bindende eiwitten (RBP’s). c Parallelle analyse van RNA-structuur (PARS) (roze) en DMS (blauw) structurele inhoud van verschillende RNA-types (Ensembl). d Semantische groepering van gen-ontologie termen geassocieerd met de minst en meest gestructureerde RNA’s (100 minder gestructureerde (LS) vs. 100 hoog gestructureerde (HS) transcripten) met behulp van cleverGO. e Door de analyse van individuele RNA’s (Figs. 1 en 2b) vonden we dat de structurele inhoud is gekoppeld aan het aantal partners en de functie van een RNA. Onze analyse geeft aan dat functioneel verwante RNA’s een vergelijkbare structurele inhoud hebben (Fig. 2c). De structuur-gedreven eiwit interactiviteit is een intrinsieke eigenschap geassocieerd met het RNA dat kan worden getraceerd op elk regulatoir niveau. f Elke rij toont de catRAPID interactie propensiteiten veroorzaakt door het verwijderen van een fysisch-chemische eigenschap 13,32. Het verwijderen van α-helix (Chou) en polariteit (Grantham) verminderen het vermogen om onderscheid te maken tussen HS en LS (p-waarden geschat met KS test). g multicleverMachine analyse van de fysisch-chemische eigenschappen van drie RBP sets en eiwitten geannoteerd in UniProt als binders van dubbelstrengs RNAs (DS) of enkelstrengs RNAs (SS) (zie Methoden). “Disorder propensity” en “α-helix” zijn de eigenschappen die significante verschillen en tegengestelde resultaten laten zien tussen DS en SS binders voor ten minste twee RBP databases (blauw of roze geven aan dat DS of SS verrijkt of verarmd zijn; geel geeft geen significante verschillen tussen de sets aan). In b, c geven de vakjes de interkwartielafstand (IQR) aan, de centrale lijn de mediaan, de inkepingen het 95%-betrouwbaarheidsinterval van de mediaan, de schijven 1,5 maal de IQR opgeteld bij het 75-percentiel (bovengrens vakje) en 1,5 maal de IQR afgetrokken van het 25-percentiel (ondergrens vakje). S.d. wordt getoond

De twee transcripten met de grootste overeenkomst (99,31%) zijn de γ-globines HBG1 en HBG2 (hemoglobinesubeenheden γ1 en γ2) die tot expressie komen in foetale lever, milt en beenmerg (NCBI Gene ID: 3048). De γ-globine variant met hogere structuur (HBG1) heeft een significant groter aantal eiwit interactoren (HBG1, gemiddeld DMS signaal van 0.04, 29 interactoren; HBG2, gemiddeld DMS signaal van 0.07, 14 interactoren; p waarde = 0.003; KS test; Fig. 2b). Terwijl de nucleotide samenstelling van de twee transcripten vrijwel gelijk blijft (HBG1:280c, 463c, 514t, 552a, 575g; HBG2: 280t, 463g, 514g, Δ552a, 574a), zijn de verschillen tussen HBG1 en HBG2 geconcentreerd in regio’s waar de secundaire structuur is veranderd (supplementaire Fig. 2). Deze resultaten wijzen erop dat de interactiviteit van eiwitten nauw samenhangt met conformationele veranderingen in elementen van de secundaire structuur. Interessant is dat de verhoogde dubbelstrengs inhoud in HBG1, vooral in de 3′-UTR, gepaard gaat met een accumulatie van translatie regulerende elementen (Fig. 2b) en een gelijktijdige afname in expressie (NCBI Gene ID: 3048).

We vroegen ons vervolgens af of specifieke RNA structuren betrokken zijn bij eiwitregulatie. We verdeelden het menselijke transcriptoom in verschillende klassen en analyseerden hun secundaire structuur zoals gedetecteerd door twee onafhankelijke experimentele technieken, PARS en DMS. Beide technieken tonen aan dat eiwit-coderende RNA’s de grootste structurele inhoud hebben (Fig. 2c, supplementaire tabel 1)38. Hoewel een deel van de mRNA-structuur geconcentreerd is in de UTR’s8, verandert de verdeling van de structurele inhoud niet wezenlijk wanneer deze worden uitgesloten (Pearson’s correlatie tussen transcripten met en zonder hun UTR’s = 0,94; supplementaire Fig. 3). De RNA’s waarvan bekend is dat zij met eiwitten interageren, zoals kleine nucleaire RNA’s (snRNA’s)40 en kleine nucleolaire RNA’s (snoRNA’s)28, vertonen de grootste hoeveelheid structuur, terwijl RNA’s die gericht zijn op complementaire regio’s in nucleïnezuren, zoals antisense, miRNA’s en een aantal lange intergene niet-coderende RNA’s (lincRNA’s)41,42 de kleinste hoeveelheid structuur vertonen43 (aanvullende tabel 1).

In overeenstemming met onze bevindingen, hebben Seemann et al.12 eerder een nauwe relatie waargenomen tussen eiwitbinding en behoud van structurele elementen in mRNA’s, die in mindere mate voorkomen in lange niet-coderende RNA’s12. Hoewel lincRNA’s een lagere hoeveelheid dubbelstrengs regio’s vertonen (de laagste in PARS, de op twee na laagste in DMS), merken we op dat sommige van hen, zoals bijvoorbeeld NEAT144 en XIST27, in staat zijn om eiwitassemblage te schragen door middel van gestructureerde domeinen. Aangezien er een discussie gaande is over de structurele verschillen tussen coderende en niet-coderende transcripten45,46 en onze analyse van DMS- en PARS-gegevens tegenstrijdige resultaten laat zien voor specifieke RNA-typen, stellen wij voor om in toekomstige studies verder onderzoek te doen (Fig. 2c; Supplementary Table 1).

Om functionele verschillen tussen sterk en slecht gestructureerde RNA’s te onderzoeken, analyseerden wij GO-termen die geassocieerd zijn met de minst en meest gestructureerde RNA’s (100 LS vs. 100 HS transcripten) met behulp van de slimmeGO35 benadering. Terwijl de LS set (14 niet-coderende RNA’s en 86 mRNA’s) niet geassocieerd is met specifieke semantische gelijkenis clusters (totaal van 36 termen met p waarde <0,05; Bonferroni test), de HS set (100 mRNA’s; totaal van 395 termen met p waarde <0,05 en 103 termen met p waarde <0,01; Bonferroni test; Fig. 2d) omvat 20 verschillende clusters. De vijf hoofdcategorieën die met de clusters geassocieerd zijn en ten minste een kwart van de vermeldingen omvatten zijn: (i) complexe eiwitregulatie (49/103), (ii) nucleoside metabolisch proces (39/103), (iii) cellulaire respons (29/103), (iv) genexpressie (29/103) en (v) eiwit targeting (28/103). We herhaalden ook de GO term analyse met als achtergrond de 25% hoger tot expressie komende transcripten en verkregen vergelijkbare resultaten (K562 stam GENCODE, Methods, Supplementary Fig. 4).

De clusteranalyse onthult de intrigerende bevinding dat transcripten met een sterke structurele inhoud meer interageren met polypeptiden en coderen voor eiwitten die betrokken zijn bij regulerende functies en bij de vorming van complexe contactnetwerken. Gezien de relatie tussen RNA-structuur en aantal eiwitinteracties (fig. 1), is een voorlopige interpretatie van onze resultaten dat een hoge mate van controle vereist is voor genen die de activiteit van een groot aantal cellulaire netwerken coördineren47. Onze analyse suggereert dus een ‘recursieve’ eigenschap: transcripten met een hoog contact coderen voor eiwitten met een hoog contact (Fig. 2e)20,48.

Disorde en helix onderscheiden dsRNA vs. ssRNA

Om de moleculaire basis van de structuurgedreven interactiviteit van RNA-moleculen te begrijpen, analyseerden we welke fysisch-chemische eigenschappen van de eiwitten de HS- en LS-reeksen beter onderscheiden. Wij bestudeerden alle 10 variabelen die in het catRAPID algoritme (Fig. 2f)13,32 worden gebruikt en verwijderden ze een voor een om de invloed op de voorspelling van RNA-eiwit interacties in te schatten. Wij vonden dat het vermogen om onderscheid te maken tussen de minst en meest gestructureerde RNA’s (100 HS en LS transcripten; Supplementary Data 3) sets wordt meer beïnvloed wanneer de polariteit (p waarde = 0,28; KS test) en α-helicale neiging (p waarde = 0,06; KS test) worden verwijderd (Fig. 2f). De eigenschap die het meest van invloed is op de HS bindingsneiging is polariteit, die verrijkt is in structureel ongeordende eiwitten49 en anticorreleert met hydrofobiciteit, die de sleutel is in macro-moleculaire herkenning (supplementaire tabel 2)50. Wat betreft de α-helicale neiging, merken we op dat de helices de meest frequente structurele elementen zijn die betrokken zijn bij de vorming van contacten met dubbelstrengs regio’s en voorkomen in dsRBD en zinkvingers29 (Supplementary Table 3). Onze waarneming suggereert een mogelijke co-evolutie tussen eiwitten en RNA’s: terwijl het RNA complexe vormen aanneemt om bindingsgebieden bloot te leggen, veranderen eiwitten hun structurele inhoud. In overeenstemming met de sleutelslot-theorie51 stellen wij voor dat natuurlijke selectie de voorkeur geeft aan sterk gestructureerde RBP’s als interactoren van dsRNA’s.

We hebben het belang van eiwitpolariteit en spiraalstructuur gevalideerd door drie datasets van goed bestudeerde RBP’s (humaan en gist)52,53,54 te vergelijken met twee sets eiwitten die uit UniProt zijn gehaald (alle organismen) als ofwel uitsluitend ssRNA binders (453 eiwitten) of dsRNA binders (390 eiwitten; aanvullende gegevens 4). Analyse van biofysische eigenschappen met de cleverMachine aanpak55 toonde aan dat ssRNA binders en dsRNA binders verschillen voor twee eigenschappen: wanorde en α-helix inhoud (Fig. 2g). De vergelijking van de twee sets, een tegen de andere, geven aan dat RBP’s interactie met zeer gestructureerde RNA’s zijn gestructureerd en hydrofoob, terwijl ongeordende en polaire RBP’s associëren met minder gestructureerde RNA’s (Supplementary Fig. 5). Onze analyse breidt dus verder uit wat eerder werd gerapporteerd voor eiwit-eiwit interactienetwerken, waarin structurele ongeordende regio’s een centrale rol blijken te spelen47, en suggereert nieuwe regels voor nucleotide baseparing met aminozuren.

RNA structuurgehalte en eiwitcontact in chaperones

De analyse van het humane transcriptoom en over organismen heen geven aan dat zeer gestructureerde RNA’s geneigd zijn tot interactie met polypeptiden en, op hun beurt, coderen voor eiwitten die betrokken zijn bij biologische processen die geassocieerd zijn met grote en complexe contactnetwerken. Om de structuur-gedreven eiwit interactiviteit van RNA moleculen beter te onderzoeken, hebben we ons gericht op een klasse van transcripten die coderen voor eiwitten die met meerdere partners interageren. De natuurlijke keuze voor deze analyse is de moleculaire chaperones, zoals zij bevorderen vouwen in de natieve staat56 en organiseren de montage van fase-gescheiden RNP assemblages57, waardoor het vervullen van de ‘recursieve’ eigenschap gepresenteerd in Fig. 2d. eCLIP data30 tonen aan dat de meeste van de RNA’s coderen voor menselijke chaperones zijn betrokken bij interacties met meerdere eiwitten (Supplementary Fig. 6). Wij vonden een significante correlatie tussen eiwit-RNA en eiwit-eiwit interacties geannoteerd in BioGRID (Fig. 3a). Dit resultaat bevestigt dat transcripten die door veel RBP’s worden gebonden, ook coderen voor eiwitten met een hoog contact.

Fig. 3
figure3

Relatie tussen RNA-structuur en eiwitcontacten voor chaperones. a Contacten van RNA’s die coderen voor eiwitchaperones, gemeten door enhanced CrossLinking and ImmunoPrecipitation (eCLIP)30, en fysieke interacties van de overeenkomstige gecodeerde eiwitten, verzameld bij BioGRID; p-waarde geschat met KS-test. b Vergelijking tussen parallelle analyse van RNA-structuur (PARS) structurele inhoud en fysieke interacties van de gecodeerde eiwitten, verzameld bij BioGRID, voor het volledige transcriptoom. Het transcriptoom werd verdeeld in vijf opeenvolgende sets die elk 20% van het transcriptoom bevatten. De sets werden geselecteerd op basis van hun PARS structurele inhoud, het bereik van elke set van links naar rechts zijn: -10,7 tot -4,6; -4,6 tot -3,1; -3,1 tot -2,4; -2,4 tot -1,9; -1,9 tot -0,5. De laatste boxplot toont de verdeling van het aantal fysische interactoren opgehaald uit BioGRID voor de chaperone-eiwit familie (heat-shock-eiwitten). c PARS meting van de secundaire structuur inhoud van HS (HSP70, roze) en LS (BRaf, blauw) transcripts. Verticale stippellijnen geven de niet-vertaalde regio’s (UTR’s) aan. d PARS secundaire-structuurinhoud van HS- en LS-transcripten (p-waarde geschat met KS-test). e Venn diagram met de overlap tussen eiwit interacties, gemeten door eCLIP, van HS en LS RNAs (empirische p waarde <6 × 10-3; geschat door vergelijking met de verdeling van 1000 overlappingen van sets bemonsterd uit eCLIP RBPs). f Voorspelling van eiwit bindings neiging van HS en LS RNAs met behulp van catRAPID13,32 (p waarde geschat met KS-test). Voor b, d, f geven de boxen de interkwartielafstand (IQR) aan, de centrale lijn de mediaan, de inkepingen het 95%-betrouwbaarheidsinterval van de mediaan, de schijven 1,5 maal de IQR opgeteld bij het 75-percentiel (bovengrens box) en 1,5 maal de IQR afgetrokken van het 25-percentiel (ondergrens box). S.d. wordt getoond

Om te begrijpen of de correlatie tussen eiwit-eiwit en eiwit-RNA interacties een algemene eigenschap is of gewoon een kenmerk van de chaperon familie, analyseerden we interacties van het transcriptoom gerangschikt naar PARS-scores en 24 mRNA’s coderend voor chaperones waarvoor PARS-gegevens beschikbaar zijn (Genecards; https://www.genecards.org; ‘HSPs’ set; Methods, Fig. 3b). Wij vonden een positieve correlatie tussen de hoeveelheid RNA structuur en het aantal BioGRID interactoren van de gecodeerde eiwitten (Supplementary Fig. 7a-b). Onze berekeningen komen dus overeen met de GO analyse (Fig. 2d) en suggereren een relatie tussen mRNA en hun coderende partners: sterk gestructureerde RNA’s coderen voor sterk interagerende eiwitten.

De tot nu toe gepresenteerde gegevens suggereren dat RNA’s die verwant zijn door type (b.v. miRNA, snRNA) of functie (b.v. coderend voor chaperones) vergelijkbare structurele kenmerken delen (Fig. 2). Het zou dus mogelijk moeten zijn om verschillen in het interactienetwerk van twee niet-verwante transcripten in te schatten door hun structurele inhoud te analyseren, en vice versa. Om deze hypothese te testen, selecteerden we het zeer gestructureerde HSP70 transcript (HS RNA, log van PARS score van -1.3 overeenkomend met 26% van de dubbelstrengs inhoud, Fig. 3c) coderend voor een chaperon die essentieel is voor het reguleren van eiwitcomplex assemblages zoals clathrin mantels58 en stress granules22,57. Als controle kozen we het RNA dat codeert voor BRaf, dat minder gestructureerd is (LS RNA, score van -2.8 wat wijst op 6% dubbelstrengs inhoud volgens PARS, Fig. 3c-e) en codeert voor een oncogen dat betrokken is bij de overdracht van chemische signalen van buiten de cel naar de celkern (de structuurvergelijking wordt bevestigd door CROSS voorspellingen en DMS experimenten, zoals getoond in Supplementary Fig. 8).

Wij vonden dat HSP70 een groter aantal partners heeft (30 RBP’s geïdentificeerd door eCLIP) dan BRaf (9 eCLIP RBP’s, 6 gemeenschappelijk met HSP70, supplementaire Fig. 9), wat perfect overeenkomt met de structuur-gedreven eiwit interactiviteit eigenschap. In overeenstemming met de trend van Fig. 1b, geeft catRAPID aan dat eiwitten een grotere neiging hebben om te binden aan HSP70 dan aan BRaf (Fig. 3f). Bovendien codeert het sterk gestructureerde HSP70 voor een eiwit met een groter aantal interactoren (244 BioGRID fysische interactoren), terwijl het slecht gestructureerde BRaf een eiwitproduct heeft dat bindt aan een kleinere reeks moleculen (88 BioGRID fysische interactoren). Onze waarnemingen suggereren dat een RNA met een groot aantal interacties geneigd is om als netwerkregulator op te treden: wij speculeren dat, vanwege de hogere interactiviteit, het HSP70 transcript als chaperonne zou kunnen optreden, afhankelijk van de context.

Daarom stellen wij de hypothese dat een gestructureerd RNA, vanwege zijn hogere eiwit-interactiepotentieel, in staat is om het eiwit-interactienetwerk meer te beïnvloeden dan een slecht gestructureerd RNA. In een proof-of-concept experiment, gebruikten we een chemische verbinding, gebiotinyleerd isoxazol (b-isox) om de vorming van een vloeistof-naar-vaste fase-overgang van een eiwit assemblage59,60 die we geïncubeerd met ofwel HS (HSP70) of LS (BRaf) transcripten (Fig. 4a en aanvullende Fig. 10) te induceren. We zagen dat HS veranderde de samenstelling van het eiwit aggregaat meer dan LS RNA (Fig. 4b en aanvullende gegevens 5). Inderdaad, wanneer HS RNA werd toegevoegd, een significante verandering van de concentratie werd waargenomen voor 29 eiwitten (Fig. 4c; 21 ‘vrijgegeven’ set, zwarte stippen, en 8 ‘gehouden’ set, rode stippen in Fig. 4b), terwijl slechts negen eiwitten werden geïdentificeerd in de LS RNA geval. De samenstelling in aanwezigheid van LS RNA bleef dus vergelijkbaar met die van de achtergrondcontrole (‘statische’ set, grijze stippen in fig. 4b).

Fig. 4
figure4

Gestructureerd RNA vermindert eiwitaggregatie in vitro. a Biotine-gemodificeerd isoxazool (b-isox)-aangedreven aggregatie van HeLa-eiwitlysaat in vitro. Links, Coomassie-gekleurde gels, een representatief experiment getoond (niet bijgesneden gels worden gepresenteerd in de aanvullende Fig. 10). Centre, geaggregeerde eiwitintensiteit werd gekwantificeerd en het verschil geëvalueerd met behulp van twee-tailed t-test (p = 1 × 1 0-3; N = 3 biologische replicaten weergegeven als stippen in het beeld). S.d. wordt getoond. Rechts, experimenteel schema. De aggregatie werkzaamheid werd getest door het vergelijken van de resulterende neerslag in de aanwezigheid of afwezigheid van b-isox, dit wordt aangegeven door a + of a-, respectievelijk. b Volcano plots geven de p-waarden (Perseus maatregel) van de individuele eiwit verrijkingen in b-isox montage (N = 4 onafhankelijke biologische replicaten). De statistische significantie drempel is gemarkeerd door een horizontale lijn (zie ook Aanvullende gegevens 5). Zwarte stippen zijn eiwitten met significant verlaagde concentratie na de RNA incubatie. Rode stippen zijn eiwitten met significant verhoogde concentratie na de RNA incubatie. c Kleurgecodeerde label-free kwantificatie (LFQ) intensiteiten van eiwitten beïnvloed door de hoog gestructureerde (HS) RNA op een schaal van zwart (laag) tot rood (hoog). Hiërarchische clustering door Perseus is aangegeven. Ter vergelijking zijn de LFQ-intensiteiten van dezelfde eiwitten in controle en in aanwezigheid van het LS RNA ook uitgezet

We redeneerden dat de concurrentie van RNA met het b-isox neerslag contactnetwerk59,60 het resultaat zou kunnen zijn van directe of indirecte eiwit-RNA interacties (Fig. 5a). Toch ondersteunen de voorspellingen van catRAPID de hypothese van een direct effect: een toename van de experimentele strengheid (Supplementary Fig. 11; Methods) gaat ook gepaard met een toename van het theoretisch voorspellend vermogen (Fig. 5b). In overeenstemming met onze eerdere analyse van RNA-bindende voorkeuren, eiwitten vrijgegeven op HSP70 incubatie resultaat aanzienlijk verstoken van polariteit (Fig. 5c). Dus, ons experiment suggereert dat de structuur-gedreven eiwit interactiviteit van RNA-moleculen actief is op elk niveau, het bevorderen van individuele interacties en het veranderen van de samenstelling van condensaten 12 (Fig. 2e).

Fig. 5
figure5

Interacties binnen het ribonucleoproteïnecondensaat. a Het vrijkomen van eiwitten uit de gebiotinyleerde isoxazool (b-isox) assemblage zou het resultaat kunnen zijn van: (1) een indirect proces, als gevolg van een interactiecompetitie tussen RNA en het eiwitaggregaat of (2) een direct proces, als gevolg van eiwitsekwestratie door RNA. b catRAPID prestaties te verbeteren met de strengheid van de b-isox experimenten (Methodes), wat suggereert een directe rekrutering van eiwitten gered door hoog gestructureerde (HS) RNA. De false discovery rate (FDR) wordt zeer significant voor de meest stringente experimentele set (FDR = 0.1). c ‘Vrijgegeven’ eiwitten (zwart vak) zijn minder polair dan ‘statische’ (grijs vak), in overeenstemming met onze computationele analyse (p waarde = 4.7 × 10-2, p waarde geschat met KS test; zie ook Fig. 2f, g). Vrijgegeven en statische eiwitten komen overeen met de zwarte en grijze stippen van Fig. 4b rechter paneel. De vakjes geven de interkwartielafstand (IQR) aan, de centrale lijn de mediaan, de inkepingen het 95%-betrouwbaarheidsinterval van de mediaan, de schijven tellen 1,5 maal de IQR op bij het 75-percentiel (bovengrens vakje) en trekken 1,5 maal de IQR af van het 25-percentiel (ondergrens vakje). S.d. wordt weergegeven

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.