Frontiers / CircCode :a Powerful Tool for Identifying circRNA Coding Ability / Genetics

Introduction

Circrnas (circRNAs) zijn een speciaal type noncoding RNA molecule dat een hot research topic is geworden op het gebied van RNA en veel aandacht krijgt (Chen And Yang, 2015). Vergeleken met traditionele lineaire RNAs (die 5′ en 3′ einden bevatten), hebben circRNA molecules gewoonlijk een gesloten cirkelstructuur; die hen stabieler en minder naar voren gebogen aan degradatie maken (Vicens en Westhof, 2014). Hoewel het bestaan van circRNAs enige tijd gekend is, werden deze molecules beschouwd om een bijproduct van het verbinden van RNA te zijn. Nochtans, met de ontwikkeling van hoog-productie het rangschikken en bioinformaticatechnologieën, circRNAs zijn wijd erkend in dieren en installaties (Chen en Yang, 2015) geworden. Recente studies hebben ook aangetoond dat een groot aantal circRNAs kan worden vertaald in kleine peptiden in cellen (Pamudurti et al., 2017) en hebben een sleutelrol ondanks hun soms lage expressieniveau (Hsu and Benfey, 2018; Yang et al., 2018). Hoewel een toenemend aantal circRNAs worden geÃ dentificeerd, blijven hun functies in planten en dieren over het algemeen worden bestudeerd. Naast hun functies als Mirna lokvogels, circRNAs hebben belangrijk vertalend potentieel, maar geen hulpmiddelen zijn beschikbaar voor specifiek het voorspellen van de Vertalende mogelijkheden van deze molecules (Jakobi en Dieterich, 2019).

er bestaan verschillende instrumenten voor de voorspelling en identificatie van circRNAs, zoals CIRI (Gao et al., 2015), CIRCexplorer (Dong et al., 2019), CircPro (Meng et al., 2017), en circtools (Jakobi et al., 2018). Onder hen, CircPro kan vertaalde circRNAs onthullen door het berekenen van een vertaling potentiële score voor circRNAs op basis van CPC (Kong et al., 2007), dat is een hulpmiddel voor het identificeren van de open reading frame (ORF) in een bepaalde volgorde. Echter, omdat sommige circRNAs het startcodon niet gebruiken tijdens de vertaling (Ingolia et al., 2011; Slavoff et al., 2013; Kearse and Wilusz, 2017; Spealman et al., 2018), het gebruik van CPC kan filteren uit een aantal echt vertaald circRNAs. In deze studie gebruikten we BASiNET (Ito et al., 2018), die een RNA-classifier is die op de machine het leren methodes wordt gebaseerd (random forest en J48 model). Het transformeert aanvankelijk gegeven codage RNAs (positieve gegevens) en noncoding RNAs (negatieve gegevens) en vertegenwoordigt hen als complexe netwerken; het haalt dan de topologische maatregelen van deze netwerken uit en construeert een eigenschap vector om het model te trainen dat wordt gebruikt om de codagecapaciteit van circRNAs te classificeren. Met deze methode, wordt het onjuiste filteren van vertaalde circRNAs vermeden die niet door AUG worden geïnitieerd. Bovendien, Ribo-seq technologie, die op hoog-productie het rangschikken is gebaseerd om rpfs (ribosomal beschermde fragmenten) van afschriften te controleren (Guttman et al., 2013; Brar and Weissman, 2015), kan worden gebruikt om de locaties van circRNAs te bepalen die worden vertaald (Michel en Baranov, 2013). Om het codeervermogen van circRNAs te identificeren, ontwikkelden we de tool CircCode, die een Python 3–gebaseerd kader omvat, en toegepast CircCode om het vertaalpotentieel van circRNAs van mensen en Arabidopsis thaliana te onderzoeken. Ons werk verstrekt een rijke bron voor verdere studie van de functies van circRNAs met codagecapaciteit.

Methods

CircCode is geschreven in de programmeertaal Python 3; Het maakt gebruik van Trimmomatic (Bolger et al., 2014), bowtie (Langmead and Salzberg, 2012), en STAR (Dobin et al., 2013) om ruwe Ribo-seq te filteren leest en deze gefilterde leest aan het genoom in kaart te brengen. CircCode identificeert dan Ribo-seq read-mapped regio ‘ s in circRNAs die juncties bevatten. Na dat, wordt de kandidaat in kaart gebracht opeenvolgingen in circRNAs gesorteerd gebaseerd op classifiers (J48 model) in codage RNAs en noncoding RNAs door BASiNET. Tot slot, worden de korte peptides geproduceerd door vertaling geÃ dentificeerd als potentiële codagegebieden van circRNAs. Het hele proces van CircCode bestaat uit vijf stappen (figuur 1).

figuur 1

figuur 1 de workflow van CircCode. De bovenste laag vertegenwoordigt het invoerbestand dat nodig is voor elke stap van CircCode. De middelste laag is verdeeld in drie delen, en elk deel vertegenwoordigt een verschillende fase van de operatie. Van links naar rechts vertegenwoordigt het eerste deel de filtering van de Ribo-seq gegevens; de kwaliteitscontrole wordt uitgevoerd door Trimmomatic, en de rRNA reads worden verwijderd door bowtie. Het tweede deel vertegenwoordigt de stappen die worden gebruikt om het virtuele genoom te produceren en gefilterde leest aan het virtuele genoom met ster af te stemmen. Het laatste deel vertegenwoordigt de identificatie van vertaalde circRNAs door machine het leren. De onderste laag vertegenwoordigt de laatste stap die wordt gebruikt om peptides te voorspellen die van circRNAs en de definitieve outputresultaten worden vertaald, met inbegrip van informatie over vertaalde circRNAs en hun vertaal producten.

Filtering van ribosomale Profileringsgegevens

eerst worden fragmenten en adapters van lage kwaliteit in de Ribo-Seq-reads verwijderd door Trimmomatic met de standaardparameters om schone Ribo-seq-reads te verkrijgen. Ten tweede, worden deze schone Ribo-seq reads in kaart gebracht aan een rRNA-bibliotheek om reads te verwijderen die uit rRNA worden afgeleid gebruikend bowtie. Omdat de leeslengtes van Ribo-seq relatief kort zijn (over het algemeen minder dan 50 bp), is het mogelijk voor één gelezen om veelvoudige gebieden aan te passen. In dit geval is het moeilijk om te bepalen met welke regio een bepaalde read overeenkomt. Om dit te vermijden, worden de schone Ribo-seq leest in kaart gebracht aan het genoom van een species van belang, en leest die niet perfect aan het genoom worden afgestemd worden beschouwd als definitieve unieke Ribo-seq leest.

het samenstellen van virtuele genomen

Circrna ‘ s verschijnen gewoonlijk als ringvormige moleculen in eukaryoten, en ze kunnen worden geïdentificeerd op basis van hun back-splicing junctions. Nochtans, zijn de opeenvolgingen van circRNAs in het fasta dossier vaak in lineaire vorm. In theorie, wijst het resultaat erop dat de verbinding tussen eindnucotide 5′ en eindnucotide 3’ is, hoewel de verbinding en de opeenvolging dichtbij de verbinding niet direct kunnen worden bekeken, waarbij Ribo-seq aan circRNA opeenvolgingen, met inbegrip van verbindingen, op een duidelijke manier wordt afgestemd.

CircCode verbindt de sequentie van elke circRNA in tandem zodanig dat de junctie voor elke in het midden van de nieuw geconstrueerde sequentie ligt. Wij scheidden ook elke reekseenheid door 100 N nucleotiden om verwarring bij de opeenvolgingsrichtingsstap te vermijden (de lengte van elke RPF is minder dan 50 bp). Tenslotte verkregen we een virtueel genoom dat alleen bestaat uit kandidaat circRNAs in tandem gescheiden door 100 Ns. Omdat CircCode slechts op aanpassing tussen Ribo-seq leest en circRNA opeenvolgingen concentreert, kunnen wij het codagepotentieel van circRNAs onderzoeken door Ribo-seq leest aan dit virtuele genoom in kaart te brengen, dat een grote hoeveelheid computationele tijd kan besparen (het virtuele genoom is veel kleiner dan het gehele genoom) en de nauwkeurigheid kan verhogen (door interferentie tussen upstream en downstream opeenvolgingsvergelijkingen van circRNAs te vermijden).

bepaling van het Ribo-seq Read-Mapped gebied op een junctie (RMRJ) van circRNAs

de uiteindelijke unieke Ribo-seq reads worden in kaart gebracht op een eerder gecreëerd virtueel genoom met behulp van STAR. Omdat elke tandem circRNA eenheid werd gescheiden door 100 N basissen alvorens het virtuele genoom te produceren,werd de grootste Intron lengte ingesteld om niet meer dan 10 basissen met de parameter “–alignIntronMax 10.”Deze parameter elimineert om het even welke interactie tussen verschillende circRNAs in de opeenvolgingsuitlijning. In de tweede stap van virtuele genoomproductie, slaat CircCode positionele verbindingsinformatie voor elke circRNA in het virtuele genoom op. Als het Ribo-seq read-mapped gebied in het virtuele genoom de verbinding van circRNA omvat, en het aantal in kaart gebrachte Ribo-seq leest op Verbinding (NMJ) groter is dan 3, Kan het Ribo-seq reads-mapped gebied op Verbinding van circRNAs als RMRJ worden beschouwd, die een ruwweg vertaald segment van circRNAs dichtbij de junctieplaats openbaart.

opleiding van het Model en de classificatie van Rmrj ‘s

hoewel Rmrj’ s een krachtig bewijs van Vertaling kunnen vormen, zijn er nog enkele tekortkomingen in deze methode. Omdat de lengte van de meetwaarden van de ribosomale kaart kort is, kan een meetwaarde vergeleken worden met de verkeerde positie. Daarom is het niet overtuigend om de regio die onder de Ribo-seq valt, simpelweg te beschouwen als de vertaalde regio. Hiertoe, wordt de machine het leren methode gebruikt om de codagecapaciteit van RMRJ te identificeren. Ten eerste haalt CircCode het coderen van RNAs (positieve gegevens) en het noncoderen van RNAs (negatieve gegevens) van een soort van belang uit en gebruikt ze voor modelopleiding door middel van het verschil in kenmerkvectoren tussen het coderen en het noncoderen van RNAs. CircCode gebruikt vervolgens het getrainde model om de Rmrj ‘ s te classificeren die in de vorige stap zijn verkregen door BASiNET. Als RMRJ van circRNA als codage-RNA wordt erkend, dan kan dit circRNA als vertaalde circRNA worden geÃ dentificeerd.

voorspelling van vertaalde peptiden door Rmrj ‘ s

aangezien de expressie van circRNAs in organismen laag is, tonen de Ribo-seq-gegevens niet duidelijk de exacte 3-nt-periodiciteit in het geval van minder RPFs. Daarom is het moeilijk om de exacte vertaalbeginplaats van een vertaalde circRNA te bepalen. Vanwege de aanwezigheid van een stopcodon in sommige Rmrj ‘ s en omdat het startcodon moeilijk te bepalen is, is de methode om een ORF te vinden op basis van een startcodon en een stopcodon niet haalbaar.

om de ware vertaalgebieden van deze circrna ‘ s te bepalen en het uiteindelijke vertaalproduct te genereren, FragGeneScan (Rho et al., 2010), die eiwit-codeert gebieden in gefragmenteerde genen en genen met frameshifts kan voorspellen, wordt gebruikt om vertaalde peptides te bepalen die door circRNAs worden geproduceerd.

om het omslachtige lopende proces te vermijden, kunnen alle modellen worden aangeroepen door een shell script; de gebruiker kan eenvoudig het gegeven configuratiebestand invullen en het in het script invoeren, en het gehele proces voor het voorspellen van de vertaalde circRNAs zal dan worden uitgevoerd. Bovendien kan CircCode stap voor stap afzonderlijk worden uitgevoerd, zodat de gebruiker de parameters in het midden van de procedure kan aanpassen en de resultaten van elke stap naar wens kan bekijken.

resultaten en discussie

na het testen op meerdere computers bleek CircCode succesvol te draaien met de vereiste afhankelijkheden geïnstalleerd. Om de prestaties van CircCode te testen, gebruikten we gegevens voor mensen en A. thaliana om circRNAs met vertaalpotentieel te voorspellen. De resultaten werden vergeleken met circRNAs die experimenteel als bevestiging zijn geverifieerd. Daarna hebben we de false discovery rate (FDR) waarde van CircCode verder getest. We gebruikten GenRGenS (Ponty et al., 2006) om een gegevensverzameling voor het testen te produceren die op bekende vertaalde circRNAs wordt gebaseerd en bevestigde dat de FDR-waarde binnen een aanvaardbaar bereik en op een laag niveau was. Tot slot evalueerden we het effect van verschillende sequencing diepten van Ribo-seq gegevens op CircCode voorspellingen en vergeleken CircCode met andere software.

vertaalde circRNAs bij mensen en A. thaliana

om de CircCode tool toe te passen op echte data, hebben we eerst de bestanden gedownload, waaronder het menselijk referentie genoom GRCh38, genoomannotatie en menselijk rRNA, van Ensembl. Voor A. thaliana werden de referentie genomen (TAIR10), genoom annotatiebestanden en bijbehorende rRNA-sequenties allemaal gedownload van Ensembl-planten. De Ribo-seq gegevens voor mensen en A. thaliana werden gedownload van RPFdb (toetredingsnummers: GSE96643, GSE81295, GSE88794) (Hsu et al., 2016; Willems et al., 2017), en alle kandidaat circRNAs van mens en A. thaliana werden gedownload van CIRCPedia v2 (Dong et al., 2018) en Plantcirbbase, respectievelijk (Chu et al., 2017). Uiteindelijk identificeerden we 3.610 vertaalde circRNAs van de mens en 1.569 vertaalde circRNAs van A. thaliana met behulp van CircCode (aanvullende gegevens 1).

functionele verrijking van mens en A. thaliana circRNAs met Coderingspotentieel

gebruikmakend van de Circcoderesultaten voor mens en A. thaliana, de online tool KOBAS 3.0 (Wu et al., 2006) werd aangewend om deze vertaalde circRNAs te annoteren op basis van hun oudergenen. Verder voerden we GO (Gene ontologie) functionele analyse en Kegg (Kyoto Encyclopedia of Genes and Genomes) verrijking analyse voor deze vertaalde circRNAs met behulp van de R pakket clusterProfiler (Yu et al., 2012).

de KEGG-resultaten toonden aan dat de menselijke circRNAs verrijkt waren door eiwitverwerking in de endoplasmatische reticulumroute, de koolstofmetabolismeroute en de RNA-transportroute. GO-analyse wees op de deelname van menselijke vertaalde circRNAs in de verordening van molecuulband, ATPase-activiteit, en andere RNA-verbindende biologische processen. Bovendien zijn de vertaalde circRNAs van A. thaliana verrijkt in wegen die verband houden met spanningsweerstand, die suggereren dat zij essentiële rollen in dit proces spelen (aanvullende gegevens 2).

nauwkeurigheidstest voor CircCode

om de nauwkeurigheid van CircCode te onderzoeken, werden testsequenties gegenereerd door GenRGenS, die gebruik maken van het verborgen Markov-model om sequenties te produceren die dezelfde sequentiekenmerken hebben (zoals de frequenties van verschillende nucleotiden, verschillende codons en verschillende nucleotiden aan het begin van de sequentie).

voor deze studie gebruikten we eerder gepubliceerde human translated circRNAs (Yang et al., 2017) als input voor GenRGenS en genereerde 10.000 sequenties om CircCode te testen. We herhaalden de test 10 keer, en gemiddeld werden 27 vertaalde circRNAs elke keer voorspeld. De FDR-waarde werd berekend op 0,0027, wat veel minder is dan 0,05, wat aangeeft dat de voorspelde resultaten geloofwaardig zijn.

bovendien vergeleken we de vertaalde circRNAs van mensen zoals geïdentificeerd door CircCode met geverifieerde polysoom-geassocieerde circRNA-gegevens (Yang et al., 2017). Onder hen werd 60% van de circrna ‘ s geïdentificeerd door CircCode (aanvullende gegevens 3).

invloed van de Ribo-seq Data Sequencing Depth

om de impact van de sequencing depth van Ribo-seq data op de CircCode identificatie resultaten te onderzoeken, hebben we eerst het effect van sequencing depth getest op het aantal vertaalde circrna ‘ s (Figuur 2A). Toen de het rangschikken diepte laag was, was het voorspelde aantal vertaalde circRNAs laag, en het aantal vertaalde circRNAs steeg met stijgende het rangschikken diepte. Het aantal vertaalde circRNAs werd stabiel toen de het rangschikken diepte niet minder dan 10× lineaire transcript dekking bereikte.

figuur 2

Figuur 2 (A) Effect van Ribo-seq gegevens die diepte rangschikken op het voorspelde aantal vertaalde circRNAs. (B) het effect van junction read number (JRN) op Circcodegevoeligheid bij verschillende sequentiedieptes.

ten tweede werd ook de invloed van NMJ op de gevoeligheid bij verschillende sequentiedieptes beoordeeld (figuur 2B). De resultaten toonden aan dat NMJ minder invloed op gevoeligheid had aangezien de het rangschikken diepte toenam. CircCode had ook hogere gevoeligheid wanneer het gebruiken van Ribo-seq gegevens met het hogere rangschikken van diepte.

vergelijking van CircCode met andere Tools

om CircCode te vergelijken met andere tools, zoals CircPro, werd dezelfde set Ribo-seq data (SRR3495999) van A. thaliana gebruikt om vertaalde circna ‘ s te identificeren met behulp van zes processoren, met 16 gigabyte RAM. CircPro identificeerde 44 vertaalde circRNAs in 13 min, terwijl CircCode 76 vertaalde circRNAs in 20 min identificeerde. CircCode is dus gevoeliger dan CircPro op hetzelfde computerhardwareniveau, maar het kost meer tijd. CircPro is beknopt en minder tijdrovend dan CircCode, maar CircCode kan meer circRNAs met codeercapaciteit dan CircPro identificeren.

conclusies

Circrna ’s spelen een belangrijke rol in de biologie en het is van cruciaal belang om circrna’ s met codeervermogen voor volgend onderzoek nauwkeurig te identificeren. Gebaseerd op Python 3, ontwikkelden wij CircCode, een gemakkelijk te gebruiken opdrachtregelhulpmiddel dat hoge gevoeligheid voor het identificeren van vertaalde circRNAs van Ribo-Seq leest met hoge nauwkeurigheid heeft. CircCode vertoont goede prestaties bij zowel planten als dieren. Toekomstige werkzaamheden zullen de stroomafwaartse karakteranalyse aan CircCode toevoegen door elke stap in het proces te visualiseren en de nauwkeurigheid van de voorspelling te optimaliseren.

beschikbaarheid en vereisten

CircCode is beschikbaar op https://github.com/PSSUN/CircCode; besturingssysteem(en): Linux, programmeertalen: Python 3 en R; andere vereisten: bedtools (versie 2.20.0 of hoger), bowtie, STAR, Python 3 pakketten (Biopython, Panda ‘ s, rpy2), R-pakketten (BASiNET, Biostrings). De installatiepakketten voor alle benodigde software zijn beschikbaar op de CircCode homepage. Gebruikers hoeven ze niet individueel te downloaden. De CircCode home page biedt ook gedetailleerde gebruikershandleidingen ter referentie. De tool is vrij beschikbaar. Er zijn geen beperkingen op het gebruik door nonacademics.

Gegevensbeschikbaarheidsverklaring

alle relevante gegevens bevinden zich in het manuscript en de bijbehorende informatiebestanden.

Auteursbijdragen

conceptualisatie: PS, GL. Datacuratie: PS, GL. Formele analyse: PS, GL. Schrijven-originele ontwerp: PS, GL. Schrijven-beoordelen en bewerken: PS, GL.

financiering

dit werk werd ondersteund door subsidies van de National Natural Science Foundation of China (subsidies nrs. 31770333, 31370329 en 11631012), het programma voor excellente talenten in de nieuwe eeuw in de Universiteit (NCET-12-0896), en de fondsen voor fundamenteel onderzoek voor de centrale universiteiten (nr. GK201403004). De financieringsinstanties hadden geen rol in de studie, de opzet ervan, de gegevensverzameling en-analyse, het besluit tot publicatie of de voorbereiding van het manuscript. De financiers hadden geen rol in het ontwerp van de studie, het verzamelen en analyseren van gegevens, het besluit tot publicatie of de voorbereiding van het manuscript.

belangenconflict

de auteurs verklaren dat het onderzoek werd uitgevoerd zonder enige commerciële of financiële relatie die als een potentieel belangenconflict kon worden opgevat.

aanvullend materiaal

het aanvullende materiaal voor dit artikel is online te vinden op: https://www.frontiersin.org/articles/10.3389/fgene.2019.00981/full#supplementary-material

aanvullende gegevens 1 / de volgorde van de voorspelde vertaalde circRNA en korte peptide.

aanvullende gegevens 2 / GO verrijking en Kegg verrijking resultaten voor mensen en Arabidopsis thaliana.

aanvullende gegevens 3 / vergelijking van voorspelde vertaalde circRNAs met gevalideerde vertaalde circRNAs.

Bolger, A. M., Lohse, M., Usadel, B. (2014). Trimmatic: een flexibele trimmer voor illumina sequentiegegevens. Bioinformatics 30, 2114-2120. doi: 10.1093 / bioinformatics / btu170

PubMed Abstract / CrossRef Full Text / Google Scholar

Brar, G. A., Weissman, J. S. (2015). Het ribosoomprofileren onthult wat, wanneer, waar en hoe van eiwitsynthese. Nat. Rev. Mol. Cel Biol. 16, 651–664. doi: 10.1038 / nrm4069

PubMed Abstract / CrossRef Full Text / Google Scholar

Chen, L.-L., Yang, L. (2015). Regulatie van circRNA biogenese. RNA Biol. 12, 381–388. doi: 10.1080/15476286.2015.1020271

PubMed Abstract / CrossRef Full Text / Google Scholar

Chu, Q., Zhang, X., Zhu, X., Liu, C., Mao, L., Ye, C., et al. (2017). PlantcircBase: een database voor plant circulaire RNAs. Mol. Plant 10, 1126-1128. doi: 10.1016 / j.molp.2017.03.003

PubMed Abstract / CrossRef Full Text / Google Scholar

Dobin, A., Davis, C. A., Schlesinger, F., Drenkow, J., Zaleski, C., Jha, S., et al. (2013). Ster: ultrasnelle universele RNA-seq aligner. Bioinformatica 29, 15-21. doi: 10.1093 / bioinformatics / bts635

PubMed Abstract / CrossRef Full Text / Google Scholar

Dong, R., Ma, X.-K., Chen, L.-L., Yang, L. (2019). “Genome-wide annotation of circRNAs and their alternative back-splicing / splicing with CIRCexplorer Pipeline,” in Epitranscriptomics. EDS. Wajapeyee, N., Gupta, R. (New York, NY: Springer New York), 137-149. doi: 10.1007/978-1-4939-8808-2_10

CrossRef Full Text / Google Scholar

Dong, R., Ma, X.-K., Li, G.-W., Yang, L. (2018). CIRCpedia v2: een bijgewerkte database voor uitgebreide circulaire RNA annotatie en expressie vergelijking. Genomics Proteomics Bioinf. 16, 226–233. doi: 10.1016 / j.gpb.2018.08.001

CrossRef Full Text / Google Scholar

Gao, Y., Wang, J., Zhao, F. (2015). CIRI: een efficiënt en onbevooroordeeld algoritme voor de novo circulaire RNA-identificatie. Genome Biol. 16, 4. doi: 10.1186 / s13059-014-0571-3

PubMed Abstract / CrossRef Full Text / Google Scholar

Guttman, M., Russell, P., Ingolia, N. T., Weissman, J. S., Lander, E. S. (2013). Ribosoom het profileren verstrekt bewijsmateriaal dat de grote noncoding RNAs geen proteã nen coderen. Cel 154, 240-251. doi: 10.1016 / j.cel.2013.06.009

PubMed Abstract / CrossRef Full Text / Google Scholar

Hsu, P. Y., Benfey, P. N. (2018). Klein maar machtig: functionele peptiden gecodeerd door kleine ORFs in installaties. PROTEOMICS 18, 1700038. doi: 10.1002 / pmic.201700038

CrossRef Full Text / Google Scholar

Hsu, P. Y., Calviello, L., Wu, H.-Y. L., Li, F.-W., Rothfels, C. J., Ohler, U., et al. (2016). Super-resolutie ribosoom profilering onthult niet-geannoteerde vertaalgebeurtenissen in Arabidopsis. Proc. Natl. Acad. Sci. 113, E7126-E7135. doi: 10.1073 / pnas.1614788113

CrossRef Full Text / Google Scholar

Ingolia, N. T., Lareau, L. F., Weissman, J. S. (2011). Ribosoom profilering van muis embryonale stamcellen onthult de complexiteit en dynamiek van zoogdierproteomes. Cel 147, 789-802. doi: 10.1016 / j.cel.2011.10.002

PubMed Abstract / CrossRef Full Text / Google Scholar

Ito, E. A., Katahira, I., Vicente, F. F., da, R., Pereira, L. F. P., Lopes, F. M. (2018). BASiNET-BiologicAl Sequences NETwork: een gevalstudie over het coderen en niet-coderen RNAs identificatie. Nucleïnezuren res.46, e96–e96. doi: 10.1093/nar/gky462

PubMed Abstract | CrossRef Full Text | Google Scholar

Jakobi, T., Dieterich, C. (2019). Computational approaches for circular RNA analysis. Wiley Interdiscip. Rev. RNA,10 (3), e1528. doi: 10.1002/wrna.1528

PubMed Abstract | CrossRef Full Text | Google Scholar

Jakobi, T., Uvarovskii, A., Dieterich, C. (2018). circtools—a one-stop software solution for circular RNA research. Bioinformatics 35 (13), 2326–2328. doi: 10.1093 / bioinformatics / bty948

CrossRef Full Text / Google Scholar

Kearse, M. G., Wilusz, J. E. (2017). Non-AUG vertaling: een nieuwe start voor eiwitsynthese in eukaryoten. Genes Dev. 31, 1717–1731. doi: 10.1101/gad.305250.117

PubMed Abstract / CrossRef Full Text / Google Scholar

Kong, L., Zhang, Y., Ye, Z.-Q., Liu, X.-Q., Zhao, S.-Q., Wei, L., et al. (2007). CPC: beoordeel het eiwit-codeert potentieel van afschriften gebruikend opeenvolgingseigenschappen en steun vectormachine. Nucleïnezuren Res. 35, W345-W349. doi: 10.1093/nar / gkm391

PubMed Abstract / CrossRef Full Text / Google Scholar

Langmead, B., Salzberg, S. L. (2012). Snelle gapped-lezen uitlijning met vlinderdas 2. Nat. Methods 9, 357-359. doi: 10.1038 / nmeth.1923

PubMed Abstract / CrossRef Full Text / Google Scholar

Meng, X., Chen, Q., Zhang, P., Chen, M. (2017). CircPro: een geïntegreerd hulpmiddel voor de identificatie van circRNAs met eiwit-codeert potentieel. Bioinformatics 33, 3314-3316. doi: 10.1093 / bioinformatics / btx446

PubMed Abstract / CrossRef Full Text / Google Scholar

Michel, A. M., Baranov, P. V. (2013). Ribosoom profilering: een Hi-Def monitor voor eiwitsynthese op de genoombrede schaal: ribosoom profilering. Wiley Interdiscip. Rev. RNA 4, 473-490. doi: 10.1002 / wrna.1172

PubMed Abstract / CrossRef Full Text / Google Scholar

Pamudurti, N. R., Bartok, O., Jens, M., Ashwal-Fluss, R., Stottmeister, C., Ruhe, L., et al. (2017). Vertaling van CircRNAs. Mol. Cel 66, 9-21.e7. doi: 10.1016 / j.molcel.2017.02.021

PubMed Abstract / CrossRef Full Text / Google Scholar

Ponty, Y., Termier, M., Denise, A. (2006). GenRGenS: software voor het genereren van willekeurige genomische sequenties en structuren. Bioinformatica 22, 1534-1535. doi: 10.1093 / bioinformatics / btl113

PubMed Abstract / CrossRef Full Text / Google Scholar

Rho, M., Tang, H., Ye, Y. (2010). FragGeneScan: het voorspellen van genen in korte en foutgevoelige leest. Nucleic Acids res. 38, e191-e191. doi: 10.1093/nar / gkq747

PubMed Abstract / CrossRef Full Text / Google Scholar

Slavoff, S. A., Mitchell, A. J., Schwaid, A. G., Cabili, M. N., Ma, J., Levin, J. Z., et al. (2013). Peptidomic ontdekking van korte open lezingskader-gecodeerde peptides in menselijke cellen. Nat. Scheikunde. Biol. 9, 59–64. doi: 10.1038 / nchembio.1120

PubMed Abstract / CrossRef Full Text / Google Scholar

Spealman, P., Naik, A. W., May, G. E., Kuersten, S., Freeberg, L., Murphy, R. F., et al. (2018). Behouden niet-AUG uORFs onthuld door een nieuwe regressieanalyse van ribosoom profilering gegevens. Genome Res. 28, 214-222. doi: 10.1101 / gr.221507.117

PubMed Abstract / CrossRef Full Text / Google Scholar

Vicens, Q., Westhof, E. (2014). Biogenese van circulaire RNAs. Cel 159, 13-14. doi: 10.1016 / j.cel.2014.09.005

PubMed Abstract / CrossRef Full Text / Google Scholar

Willems, P., Ndah, E., Jonckheere, V., Stael, S., Sticker, A., Martens, L., et al. (2017). N-terminal proteomics assisteerde de profilering van het onontgonnen vertaalinitiatielandschap in Arabidopsis thaliana. Mol. Cel. Proteomics 16, 1064-1080. doi: 10.1074 / mcp.M116. 066662

PubMed Abstract / CrossRef Full Text / Google Scholar

Wu, J., Mao, X., Cai, T., Luo, J., Wei, L. (2006). KOBAS server: een web-based platform voor geautomatiseerde annotatie en pathway identificatie. Nucleïnezuren Res.34, W720–W724. doi: 10.1093/nar / gkl167

PubMed Abstract / CrossRef Full Text / Google Scholar

Yang, L., Fu, J., Zhou, Y. (2018). Circulaire RNAs en hun opkomende rollen in immuunregulatie. Voorkant. Immunol. 9, 2977. doi: 10.3389 / fimmu.2018.02977

PubMed Abstract / CrossRef Full Text / Google Scholar

Yang, Y., Fan, X., Mao, M., Song, X., Wu, P., Zhang, Y., et al. (2017). Uitgebreide vertaling van circulaire RNAs gedreven door N6-methyladenosine. Cel Res. 27, 626-641. doi: 10.1038 / cr.2017.31

PubMed Abstract / CrossRef Full Text / Google Scholar

Yu, G., Wang, L.-G., Han, Y., He, Q.-Y. (2012). clusterProfiler: an R package for comparing biological themes among gene clusters. OMICS J. Integr. Biol. 16, 284–287. doi: 10.1089/omi.2011.0118

CrossRef Full Text | Google Scholar

Frontiers in Genetics

Introduction

Methods

Filtering van ribosomale Profileringsgegevens

het samenstellen van virtuele genomen

bepaling van het Ribo-seq Read-Mapped gebied op een junctie (RMRJ) van circRNAs

opleiding van het Model en de classificatie van Rmrj ‘s

voorspelling van vertaalde peptiden door Rmrj ‘ s

resultaten en discussie

vertaalde circRNAs bij mensen en A. thaliana

functionele verrijking van mens en A. thaliana circRNAs met Coderingspotentieel

nauwkeurigheidstest voor CircCode

invloed van de Ribo-seq Data Sequencing Depth

vergelijking van CircCode met andere Tools

conclusies

beschikbaarheid en vereisten

Gegevensbeschikbaarheidsverklaring

Auteursbijdragen

financiering

belangenconflict

aanvullend materiaal

Geef een antwoord Antwoord annuleren