Gränser / CircCode: ett kraftfullt verktyg för att identifiera circRNA-kodningsförmåga | genetik

introduktion

cirkulära RNA (circRNAs) är en speciell typ av icke-kodande RNA-molekyl som har blivit ett hett forskningsämne inom RNA och får stor uppmärksamhet (Chen och Yang, 2015). Jämfört med traditionella linjära RNA (innehållande 5′ och 3′ ändar) har circRNA-molekyler vanligtvis en sluten cirkulär struktur; vilket gör dem mer stabila och mindre benägna att nedbrytas (Vicens och Westhof, 2014). Även om förekomsten av circRNAs har varit känd under en tid, ansågs dessa molekyler vara en biprodukt av RNA-Splitsning. Men med utvecklingen av sekvensering med hög genomströmning och bioinformatikteknik har circRNAs blivit allmänt erkända hos djur och växter (Chen och Yang, 2015). Nya studier har också visat att ett stort antal circRNAs kan översättas till små peptider i celler (Pamudurti et al., 2017) och har nyckelroller trots deras ibland låga uttrycksnivå (Hsu och Benfey, 2018; Yang et al., 2018). Även om ett ökande antal circRNAs identifieras, återstår deras funktioner i växter och djur i allmänhet att studeras. Förutom deras funktioner som miRNA-lockbete har circRNAs viktig translationspotential, men inga verktyg finns tillgängliga för att specifikt förutsäga translationsförmågan hos dessa molekyler (Jakobi och Dieterich, 2019).

flera verktyg finns för förutsägelse och identifiering av circRNAs, såsom CIRI (Gao et al., 2015), CIRCexplorer (Dong et al., 2019), CircPro (Meng et al., 2017), och circtools (Jakobi et al., 2018). Bland dem kan CircPro avslöja översatta circRNAs genom att beräkna en översättningspotentialpoäng för circRNAs baserat på CPC (Kong et al., 2007), som är ett verktyg för att identifiera open reading frame (ORF) i en given sekvens. Men eftersom vissa circRNAs inte använder startkodonet under översättning (Ingolia et al., 2011; Slavoff et al., 2013; Kearse och Wilusz, 2017; Spealman et al., 2018), anställa CPC kan filtrera bort några verkligt översatta circRNAs. I denna studie använde vi BASiNET (ito et al., 2018), som är en RNA-klassificerare baserad på maskininlärningsmetoderna (random forest och J48-modellen). Den omvandlar initialt de givna kodande RNA (positiva data) och icke-kodande RNA (negativa data) och representerar dem som komplexa nätverk; den extraherar sedan de topologiska måtten på dessa nätverk och konstruerar en funktionsvektor för att träna modellen som används för att klassificera kodningskapaciteten för circrna. Med denna metod undviks felaktig filtrering av översatta circRNAs som inte initieras av AUG. Dessutom Ribo-seq-teknik, som är baserad på sekvensering med hög genomströmning för att övervaka RPFs (ribosomala skyddade fragment) av transkript (Guttman et al., 2013; Brar och Weissman, 2015), kan användas för att bestämma platserna för circRNAs som översätts (Michel och Baranov, 2013). För att identifiera circrnas kodningsförmåga utvecklade vi verktyget CircCode, som involverar en Python 3–baserad ram, och tillämpade CircCode för att undersöka översättningspotentialen för circRNAs från människor och Arabidopsis thaliana. Vårt arbete ger en rik resurs för vidare studier av circRNAs funktioner med kodningskapacitet.

metoder

CircCode skrevs i Python 3 programmeringsspråk; den använder Trimmomatic (Bolger et al., 2014), bowtie (Langmead och Salzberg, 2012) och STAR (Dobin et al., 2013) för att filtrera rå Ribo-seq läser och kartlägger dessa filtrerade läser till genomet. CircCode identifierar sedan Ribo-seq lästa mappade regioner i circRNAs som innehåller korsningar. Därefter sorteras de kandidatmappade sekvenserna i circrna baserat på klassificerare (J48-modell) i kodande RNA och icke-kodande RNA av BASiNET. Slutligen identifieras korta peptider som produceras genom översättning som potentiella kodande regioner av circRNAs. Hela processen med Circode består av fem steg (Figur 1).

figur 1

Figur 1 arbetsflödet för CircCode. Det översta lagret representerar indatafilen som krävs för varje steg i CircCode. Mellanskiktet är uppdelat i tre delar, och varje del representerar ett annat driftsstadium. Från vänster till höger representerar den första delen filtreringen av Ribo-seq-data; kvalitetskontrollen utförs av Trimmomatic, och rRNA-avläsningarna avlägsnas av bowtie. Den andra delen representerar stegen som används för att producera det virtuella genomet och anpassa de filtrerade läsningarna till det virtuella genomet med stjärna. Den sista delen representerar identifieringen av översatta circRNAs genom maskininlärning. Bottenskiktet representerar det sista steget som används för att förutsäga peptiderna översatta från circrna och de slutliga resultaten, inklusive information om översatta circrna och deras översättningsprodukter.

filtrering av Ribosomal Profileringsdata

först avlägsnas fragment och Adaptrar av låg kvalitet i Ribo-Seq-avläsningarna av Trimmomatic med standardparametrarna för att få rena Ribo-seq-läsningar. För det andra mappas dessa rena Ribo-seq-läsningar till ett rRNA-bibliotek för att ta bort läsningar som härrör från rRNA med bowtie. Eftersom läslängderna för Ribo-seq är relativt korta (vanligtvis mindre än 50 bp) är det möjligt för en läsning att matcha flera regioner. I det här fallet är det svårt att bestämma vilken region en viss läsning motsvarar. För att undvika detta kartläggs de rena Ribo-seq-läsningarna till genomet av en art av intresse, och de läsningar som inte är perfekt anpassade till genomet betraktas som den slutliga unika Ribo-seq-läsningen.

montering av virtuella genom

CircRNAs visas vanligtvis som ringformade molekyler i eukaryoter, och de kan identifieras baserat på deras back-splicing korsningar. Sekvenserna av circRNAs i fasta-filen är emellertid ofta i linjär form. I teorin indikerar resultatet att korsningen är mellan 5′-terminalnukleotiden och 3′ – terminalnukleotiden, även om korsningen och sekvensen nära korsningen inte kan ses direkt, vilket således anpassar Ribo-seq läser till circRNA-sekvenser, inklusive korsningar, på ett enkelt sätt.

CircCode förbinder sekvensen för varje circRNA i tandem så att korsningen för varje är i mitten av den nybyggda sekvensen. Vi separerade också varje serieenhet med 100 N nukleotider för att undvika förvirring vid sekvensinriktningssteget (längden på varje RPF är mindre än 50 bp). Slutligen erhöll vi ett virtuellt genom som endast består av kandidatcirkrar i tandem åtskilda av 100 Ns. Eftersom CircCode endast fokuserar på anpassning mellan Ribo-seq läser och circRNA sekvenser, kan vi undersöka kodningspotentialen för circRNAs genom att kartlägga Ribo-seq läser till detta virtuella genom, vilket kan spara en stor mängd beräkningstid (det virtuella genomet är mycket mindre än hela genomet) och öka noggrannheten (genom att undvika störningar mellan uppströms och nedströms sekvensjämförelser av circRNAs).

bestämning av Ribo-seq Read-Mapped Region på en korsning (RMRJ) av circRNAs

den slutliga unika Ribo-seq läser mappas till ett tidigare skapat virtuellt genom med hjälp av stjärna. Eftersom varje tandem circRNA-enhet separerades av 100 N-baser innan det virtuella genomet producerades, sattes den största intron-längden till att inte överstiga 10–baser med parametern ” – alignIntronMax 10.”Denna parameter eliminerar all interaktion mellan olika circRNAs i sekvensinriktningen. I det andra steget av virtuell genomproduktion lagrar CircCode positionell korsningsinformation för varje circRNA i det virtuella genomet. Om Ribo-seq read-mapped region i det virtuella genomet inkluderar korsningen av circRNA, och antalet mappade Ribo-seq läser på korsningen (NMJ) är större än 3, Ribo-seq reads-mapped region på korsningen av circRNAs kan betraktas som en RMRJ, vilket avslöjar ett grovt översatt segment av circRNAs nära korsningsplatsen.

utbildning av modellen och klassificering av RMRJs

även om RMRJs kan utgöra ett kraftfullt bevis på översättning, finns det fortfarande vissa brister i denna metod. Eftersom längden på avläsningarna av den ribosomala kartan är kort kan en läsning jämföras med fel position. Därför är det inte övertygande att bara betrakta den region som omfattas av Ribo-seq som den översatta regionen. För detta ändamål används maskininlärningsmetoden för att identifiera rmrjs kodningsförmåga. För det första extraherar Circode kodande RNA (positiva data) och icke-kodande RNA (negativa data) från en art av intresse och använder dem för modellutbildning med hjälp av skillnaden i funktionsvektorer mellan kodande och icke-kodande RNA. CircCode använder sedan den utbildade modellen för att klassificera RMRJs som erhållits i föregående steg av BASiNET. Om RMRJ för ett circRNA känns igen som kodande RNA, kan detta circRNA identifieras som ett översatt circRNA.

förutsägelse av översatta peptider med RMRJs

eftersom uttrycket av circRNAs i organismer är lågt visar Ribo-seq-data inte den exakta 3-nt-periodiciteten tydligt när det gäller färre RPFs. Därför är det svårt att bestämma den exakta översättningsstartplatsen för en översatt circRNA. På grund av närvaron av ett stoppkodon i vissa RMRJs och eftersom startkodonet är svårt att bestämma är metoden att hitta en ORF baserad på ett startkodon och ett stoppkodon inte genomförbart.

för att bestämma de verkliga översättningsregionerna för dessa circRNAs och generera den slutliga översättningsprodukten, FragGeneScan (Rho et al., 2010), som kan förutsäga proteinkodande regioner i fragmenterade gener och gener med frameshifts, används för att bestämma de översatta peptiderna som produceras av circRNAs.

för att undvika den besvärliga körprocessen kan alla modeller anropas av ett skalskript; användaren kan helt enkelt fylla i den givna konfigurationsfilen och mata in den i skript, och hela processen för att förutsäga de översatta circrna kommer sedan att köras. Dessutom kan CircCode köras separat, steg för steg, så att användaren kan justera parametrarna mitt i proceduren och se resultaten från varje steg efter önskemål.

resultat och diskussion

efter testning på flera datorer visade sig CircCode köras med de nödvändiga beroenden installerade. För att testa prestanda för CircCode använde vi data för människor och A. thaliana för att förutsäga circRNAs med översättningspotential. Resultaten jämfördes med circRNAs som har verifierats experimentellt som bekräftelse. Därefter testade vi false discovery rate (FDR) värdet av CircCode ytterligare. Vi använde GenRGenS (Ponty et al., 2006) för att generera en datamängd för testning baserad på kända översatta circrna och bekräftade att FDR-värdet låg inom ett acceptabelt intervall och på en låg nivå. Slutligen utvärderade vi effekten av olika sekvenseringsdjup av Ribo-seq-data på Circode-förutsägelser och jämförde Circode med annan programvara.

översatta circRNAs hos människor och A. thaliana

för att tillämpa CircCode-verktyget på verkliga data laddade vi först ner filerna inklusive human reference genome GRCh38, genome annotation och human rRNA, från Ensembl. För A. thaliana hämtades referensgenomerna (TAIR10), genomanteckningsfiler och motsvarande rRNA-sekvenser från Ensembl-växter. Ribo – seq-data för människor och A. thaliana laddades ner från RPFdb (anslutningsnummer: GSE96643, GSE81295, GSE88794) (Hsu et al., 2016; Willems et al., 2017), och alla kandidat circRNAs från human och A. thaliana hämtades från CIRCPedia v2 (Dong et al., 2018) respektive PlantcircBase (Chu et al., 2017). I slutändan identifierade vi 3 610 översatta circRNAs från mänskliga och 1 569 översatta circRNAs från A. thaliana med hjälp av CircCode (kompletterande Data 1).

funktionell anrikning av humana och A. thaliana circRNAs med Kodningspotential

med hjälp av Circode-resultaten för human och A. thaliana, onlineverktyget KOBAS 3.0 (Wu et al., 2006) användes för att kommentera dessa översatta circRNAs baserat på deras modergener. Dessutom utförde vi Go (Gen ontologi) funktionell analys och KEGG (Kyoto Encyclopedia of gener och genomer) anrikningsanalys för dessa översatta circRNAs med användning av r-paketet clusterProfiler (Yu et al., 2012).

KEGG-resultaten visade att de humana circrna berikades i proteinbehandling i endoplasmatisk retikulumväg, kolmetabolismväg och RNA-transportväg. GO-analys indikerade deltagandet av humana översatta circRNAs i regleringen av molekylbindning, ATPas-aktivitet och andra RNA-splitsningsrelaterade biologiska processer. Dessutom är de översatta circRNAs av A. thaliana berikade i vägar relaterade till stressmotstånd, vilket tyder på att de spelar viktiga roller i denna process (kompletterande Data 2).

Noggrannhetstest för CircCode

för att undersöka noggrannheten hos CircCode användes testsekvenser genererade av GenRGenS, som använder den dolda Markov-modellen för att producera sekvenser som har samma sekvensegenskaper (såsom frekvenserna för olika nukleotider, olika kodoner och olika nukleotider i början av sekvensen).

för denna studie använde vi tidigare publicerade mänskliga översatta circRNAs (Yang et al., 2017) som ingång för GenRGenS och genererade 10 000 sekvenser för att testa CircCode. Vi upprepade testet 10 gånger, och i genomsnitt förutspåddes 27 översatta circRNAs varje gång. FDR-värdet beräknades vara 0,0027, vilket är mycket mindre än 0,05, vilket indikerar att de förutsagda resultaten är trovärdiga.

dessutom jämförde vi de översatta circRNAs från människor som identifierats av CircCode med verifierade polysomassocierade circRNA-data (Yang et al., 2017). Bland dem identifierades 60% av circrna med CircCode (kompletterande Data 3).

påverkan av Ribo-seq-Datasekvenseringsdjupet

för att undersöka effekten av sekvenseringsdjupet för Ribo-seq-data på CircCode-identifieringsresultaten testade vi först effekten av sekvenseringsdjupet på antalet översatta circRNAs (figur 2a). När sekvenseringsdjupet var lågt var det förutsagda antalet översatta circRNAs lågt och antalet översatta circRNAs ökade med ökande sekvenseringsdjup. Antalet översatta circRNAs blev stabilt när sekvenseringsdjupet nådde inte mindre än 10 linjär transkripttäckning.

figur 2

Figur 2 (A) Effekt av Ribo-seq-datasekvenseringsdjup på det förutsagda antalet översatta circRNAs. (B) effekten av junction read number (JRN) på Circode-känslighet vid olika sekvenseringsdjup.

för det andra, påverkan av NMJ på känslighet vid olika sekvenseringsdjup bedömdes också (Figur 2B). Resultaten visade att NMJ hade mindre inverkan på känsligheten när sekvenseringsdjupet ökade. CircCode hade också högre känslighet vid användning av Ribo-seq-data med högre sekvenseringsdjup.

jämförelse av CircCode med andra verktyg

för att jämföra CircCode med andra verktyg, såsom CircPro, samma uppsättning Ribo-seq-data (SRR3495999) från A. thaliana användes för att identifiera översatta circRNAs med sex processorer, med 16 gigabyte RAM. CircPro identifierade 44 översatta circRNAs i 13 min, medan CircCode identifierade 76 översatta circRNAs i 20 min. Således är CircCode känsligare än CircPro på samma datorhårdvarunivå, men det tar mer tid. CircPro är kortfattad och mindre tidskrävande än CircCode, men CircCode kan identifiera fler circRNAs med kodningsförmåga än CircPro.

slutsatser

CircRNAs spelar en viktig roll i biologi, och det är avgörande att exakt identifiera circRNAs med kodningsförmåga för efterföljande forskning. Baserat på Python 3 utvecklade vi CircCode, ett lättanvänt kommandoradsverktyg som har hög känslighet för att identifiera översatta circRNAs från Ribo-Seq läser med hög noggrannhet. CircCode uppvisar bra prestanda i både växter och djur. Framtida arbete kommer att lägga nedströms teckenanalys till CircCode genom att visualisera varje steg i processen och optimera noggrannheten i förutsägelsen.

tillgänglighet och krav

CircCode finns på https://github.com/PSSUN/CircCode; operativsystem(er): Linux, programmeringsspråk: Python 3 och R; andra krav: bedtools (version 2.20.0 eller senare), bowtie, STAR, Python 3 paket (Biopython, Pandas, rpy2), R-paket (BASiNET, Biostrings). Installationspaketen för all nödvändig programvara finns på Circcodes hemsida. Användare behöver inte ladda ner dem individuellt. Circcodes hemsida innehåller också detaljerade användarmanualer för referens. Verktyget är fritt tillgängligt. Det finns inga begränsningar för användning av nonacademics.

datatillgänglighet uttalande

alla relevanta data finns i manuskriptet och dess stödjande informationsfiler.

Författarbidrag

konceptualisering: PS, GL. Data Curation: PS, GL. Formell analys: PS, GL. Skriva-Original utkast: PS, GL. Skriva-granska och redigera: PS, GL.

finansiering

detta arbete stöddes av bidrag från National Natural Science Foundation of China (grant nos. 31770333, 31370329 och 11631012), programmet för New Century Excellent Talents in University (NCET-12-0896) och Grundforskningsfonderna för de centrala universiteten (no. GK201403004). Finansieringsorganen hade ingen roll i studien, dess utformning, datainsamling och analys, beslutet att publicera eller utarbetandet av manuskriptet. Finansiärerna hade ingen roll i studiedesign, datainsamling och analys, beslut att publicera eller förberedelse av manuskriptet.

intressekonflikt

författarna förklarar att forskningen genomfördes i avsaknad av kommersiella eller finansiella relationer som kan tolkas som en potentiell intressekonflikt.

tilläggsmaterial

Tilläggsmaterialet för denna artikel finns online på: https://www.frontiersin.org/articles/10.3389/fgene.2019.00981/full#supplementary-material

kompletterande Data 1 / sekvensen för den förutsagda översatta circRNA och korta peptiden.

kompletterande Data 2 / Go anrikning och KEGG anrikning resultat för människor och Arabidopsis thaliana.

kompletterande Data 3 | jämförelse av förutsagda översatta circRNAs med validerade översatta circRNAs.

Bolger, A. M., Lohse, M., Usadel, B. (2014). Trimmomatic: en flexibel trimmer för illumina sekvensdata. Bioinformatik 30, 2114-2120. doi: 10.1093 / bioinformatik / btu170

PubMed Abstrakt / CrossRef fulltext / Google Scholar

Brar, G. A., Weissman, J. S. (2015). Ribosomprofilering avslöjar vad, när, var och hur proteinsyntesen. Nat. Pastor Mol. Cell Biol. 16, 651–664. doi: 10.1038 / nrm4069

PubMed Abstrakt / CrossRef fulltext / Google Scholar

Chen, L.-L., Yang ,L. (2015). Reglering av circRNA biogenes. RNA Biol. 12, 381–388. doi: 10.1080/15476286.2015.1020271

PubMed Abstrakt / CrossRef fulltext / Google Scholar

chu, Q., Zhang, X., Zhu, X., Liu, C., Mao, L., Ye, C., et al. (2017). PlantcircBase: en databas för växtcirkulära rna. Mol. Växt 10, 1126-1128. doi: 10.1016/j.molp.2017.03.003

PubMed Abstrakt / CrossRef fulltext / Google Scholar

Dobin, A., Davis, C. A., Schlesinger, F., Drenkow, J., Zaleski, C., Jha, S., et al. (2013). Stjärna: ultrasnabb universal RNA-seq aligner. Bioinformatik 29, 15-21. doi: 10.1093 / bioinformatik / bts635

PubMed Abstrakt / CrossRef fulltext / Google Scholar

Dong, R., Ma, X.-K., Chen, L.-L., Yang, L. (2019). ”Genombrett annotering av circRNAs och deras alternativa backsplicing/splicing med CIRCexplorer Pipeline”, i Epitranscriptomics. EDS. Wajapeyee, N., Gupta, R. (New York, NY: Springer New York), 137-149. doi: 10.1007/978-1-4939-8808-2_10

CrossRef fulltext / Google Scholar

Dong, R., Ma, X.-K., Li, G.-W., Yang, L. (2018). CIRCpedia v2: en uppdaterad databas för omfattande cirkulär RNA-annotering och uttrycksjämförelse. Genomics Proteomics Bioinf. 16, 226–233. doi: 10.1016/j.gpb.2018.08.001

CrossRef Fulltext / Google Scholar

Gao, Y., Wang, J., Zhao, F. (2015). CIRI: en effektiv och opartisk algoritm för de novo cirkulär RNA-identifiering. Genome Biol. 16, 4. doi: 10.1186 / s13059-014-0571-3

PubMed Abstrakt / CrossRef fulltext / Google Scholar

Guttman, M., Russell, P., Ingolia, N. T., Weissman, J. S., Lander, E. S. (2013). Ribosomprofilering ger bevis för att stora icke-kodande RNA inte kodar för proteiner. Cell 154, 240-251. doi: 10.1016/j.cell.2013.06.009

PubMed Abstrakt / CrossRef Fulltext / Google Scholar

Hsu, P. Y., Benfey, P. N. (2018). Liten men mäktig: funktionella peptider kodade av små ORF i växter. Proteomik 18, 1700038. doi: 10.1002/pmic.201700038

CrossRef fulltext / Google Scholar

Hsu, P. Y., Calviello, L., Wu, H.-Y. L., Li, F.-W., Rothfels, C. J., Ohler, U., et al. (2016). Superupplösning ribosomprofilering avslöjar oannoterade översättningshändelser i Arabidopsis. Proc. Natl. Acad. Sci. 113, E7126-E7135. doi: 10.1073/pnas.1614788113

CrossRef Fulltext / Google Scholar

Ingolia, N. T., Lareau, L. F., Weissman, J. S. (2011). Ribosomprofilering av embryonala stamceller från mus avslöjar komplexiteten och dynamiken hos däggdjursproteomer. Cell 147, 789-802. doi: 10.1016/j.cell.2011.10.002

PubMed Abstrakt / CrossRef fulltext / Google Scholar

Ito, E. A., Katahira, I., Vicente, F. F., da, R., Pereira, L. F. P., Lopes, F. M. (2018). BASiNET-BiologicAl Sequences NETwork: en fallstudie om kodning och icke-kodande RNA-identifiering. Nukleinsyror Res. 46, e96-e96. doi: 10.1093/nar/gky462

PubMed Abstract | CrossRef Full Text | Google Scholar

Jakobi, T., Dieterich, C. (2019). Computational approaches for circular RNA analysis. Wiley Interdiscip. Rev. RNA,10 (3), e1528. doi: 10.1002/wrna.1528

PubMed Abstract | CrossRef Full Text | Google Scholar

Jakobi, T., Uvarovskii, A., Dieterich, C. (2018). circtools—a one-stop software solution for circular RNA research. Bioinformatics 35 (13), 2326–2328. doi: 10.1093/bioinformatik / bty948

CrossRef fulltext / Google Scholar

Kearse, M. G., Wilusz, J. E. (2017). Icke-AUG översättning: en ny start för proteinsyntes i eukaryoter. Gener Dev. 31, 1717–1731. doi: 10.1101/gad.305250.117

PubMed Abstrakt / CrossRef fulltext / Google Scholar

L., Zhang, Y., Ye, Z.-Q., Liu, X.-Q., Zhao, S.-Q., Wei, L., et al. (2007). CPC: bedöma proteinkodningspotentialen för transkript med hjälp av sekvensfunktioner och stödvektormaskin. Nukleinsyror Res. 35, W345-W349. doi: 10.1093/nar / gkm391

PubMed Abstrakt / CrossRef fulltext / Google Scholar

Langmead, B., Salzberg, S. L. (2012). Snabb gapped-läs anpassning med fluga 2. Nat. Metoder 9, 357-359. doi: 10.1038 / nmeth.1923

PubMed Abstrakt / CrossRef Fulltext / Google Scholar

Meng, X., Chen, Q., Zhang, P., Chen, M. (2017). CircPro: ett integrerat verktyg för identifiering av circRNAs med proteinkodningspotential. Bioinformatik 33, 3314-3316. doi: 10.1093 / bioinformatik / btx446

PubMed Abstrakt / CrossRef fulltext / Google Scholar

Michel, A. M., Baranov, P. V. (2013). Ribosomprofilering: en Hi-Def-monitor för proteinsyntes i genomskala: ribosomprofilering. Wiley Interscip. Rev. RNA 4, 473-490. doi: 10.1002 / wrna.1172

PubMed Abstrakt / CrossRef fulltext / Google Scholar

han är en av de mest kända och mest kända i världen. (2017). Översättning av CircRNAs. Mol. Cell 66, 9-21.e7. doi: 10.1016 / j.molcel.2017.02.021

PubMed Abstrakt / CrossRef Fulltext / Google Scholar

Ponty, Y., Termier, M., Denise ,A. (2006). GenRGenS: programvara för att generera slumpmässiga genomiska sekvenser och strukturer. Bioinformatik 22, 1534-1535. doi: 10.1093 / bioinformatik / btl113

PubMed Abstrakt / CrossRef fulltext / Google Scholar

Rho, M., Tang, H., Ye, Y. (2010). FragGeneScan: förutsäga gener i korta och felaktiga läsningar. Nukleinsyror Res. 38, e191-e191. doi: 10.1093/nar / gkq747

PubMed Abstrakt / CrossRef fulltext / Google Scholar

han är en av de mest kända och mest kända i världen. (2013). Peptidomisk upptäckt av korta öppna läsramkodade peptider i humana celler. Nat. Chem. Biol. 9, 59–64. doi: 10.1038 / nchembio.1120

PubMed Abstrakt / CrossRef fulltext / Google Scholar

han är en av de mest kända och mest kända i världen. (2018). Konserverade icke-AUG uORFs avslöjade av en ny regressionsanalys av ribosomprofileringsdata. Genom Res. 28, 214-222. doi: 10.1101 / gr.221507.117

PubMed Abstrakt / CrossRef Fulltext / Google Scholar

Vicens, Q., Westhof, E. (2014). Biogenes av cirkulära RNA. Cell 159, 13-14. doi: 10.1016/j.cell.2014.09.005

PubMed Abstrakt / CrossRef fulltext / Google Scholar

han är en av de mest kända och mest kända i världen. (2017). N-terminal proteomics hjälpte profilering av det outforskade översättningsinitieringslandskapet i Arabidopsis thaliana. Mol. Cell. Proteomik 16, 1064-1080. doi: 10.1074 / mcp.M116. 066662

PubMed Abstrakt / CrossRef Fulltext / Google Scholar

Wu, J., Mao, X., Cai, T., Luo, J., Wei, L. (2006). KOBAS server: en webbaserad plattform för automatiserad annotering och pathway identification. Nukleinsyror Res. 34, W720-W724. doi: 10.1093 / nar / gkl167

PubMed Abstrakt / CrossRef fulltext / Google Scholar

Yang, L., Fu, J., Zhou, Y. (2018). Cirkulära RNA och deras framväxande roller i immunreglering. Front. Immunol. 9, 2977. doi: 10.3389 / fimmu.2018.02977

PubMed Abstrakt / CrossRef fulltext / Google Scholar

Yang, Y., Fan, X., Mao, M., sång, X., Wu, P., Zhang, Y., et al. (2017). Omfattande översättning av cirkulära RNA drivna av N6-metyladenosin. Cell Res. 27, 626-641. doi: 10.1038 / cr.2017.31

PubMed Abstrakt / CrossRef Fulltext / Google Scholar

Yu, G., Wang, L.-G., Han, Y., Han, Q.-Y. (2012). clusterProfiler: an R package for comparing biological themes among gene clusters. OMICS J. Integr. Biol. 16, 284–287. doi: 10.1089/omi.2011.0118

CrossRef Full Text | Google Scholar

gränser i genetik

introduktion

metoder

filtrering av Ribosomal Profileringsdata

montering av virtuella genom

bestämning av Ribo-seq Read-Mapped Region på en korsning (RMRJ) av circRNAs

utbildning av modellen och klassificering av RMRJs

förutsägelse av översatta peptider med RMRJs

resultat och diskussion

översatta circRNAs hos människor och A. thaliana

funktionell anrikning av humana och A. thaliana circRNAs med Kodningspotential

Noggrannhetstest för CircCode

påverkan av Ribo-seq-Datasekvenseringsdjupet

jämförelse av CircCode med andra verktyg

slutsatser

tillgänglighet och krav

datatillgänglighet uttalande

Författarbidrag

finansiering

intressekonflikt

tilläggsmaterial

Lämna ett svar Avbryt svar