CIRCpedia v2:circRNA注释及表达数据库

导语

环状RNA(circular RNAs, circRNA)是一类由 mRNA 前体经反向可变剪切而来的共价闭合且保守的单链转录本,长度跨度从几十bp到几千bp,在表观遗传及各种细胞过程中发挥重要作用。CIRCpedia v2是一个更新的综合数据库,数据来源于Gene Expression Omnibus (GEO), Encyclopedia of DNA Elements (ENCODE) project, 及EMBL-European Bioinformatics Institute (EMBL-EBI)三大RNA-seq数据库其中包含来自六个不同物种(人、大小鼠、果蝇、斑马鱼)的180多个RNA-seq数据集的circRNA注释,识别到了262782个环状RNA。

各个物种环状RNA的数据量汇总

还可以通过物种,细胞系,基因名称或者基因组位置,circpedia中的环状RNA ID进行检索,数据库会给出环状RNA ID来源基因,对应的线性转录本,表达量,外显子的起始和终止位置,细胞系,保守性等信息,并可以用热图或者散点图的形式展现环状RNA在不同组织或者细胞系中的表达量。总而言之,这个数据库提供 circRNA 搜索,可视化,下载和在线可视化工具都是不在话下。

CIRCpedia v2

http://www.picb.ac.cn/rnomics/circpedia

CIRCpedia v2首页

可看到CIRCpedia v2的四大功能:检索、浏览、下载和表达差异分析工具;还有来自六个物种的185 RNA-seq数据集的分析情况,大部分数据集中在人、小鼠和果蝇上。

01

Search

这里可以通过设置好需要研究的物种(species),组织和细胞类型(cell Line),研究的基因名称或者位置或者circID,就可以进行检索:

检索结果(以CAMSAP1为例)如下,可根据需要选择显示不同数据注释方式(circRNA、A5BS、A3BS);点击“gene”下的基因名称,就会链接到genecard网站,以便更全面地了解该基因的信息(该功能目前局限于人源基因,而不适用于其他物种);“ExonStart–ExonEnd”显示同一基因在不同细胞中不同的剪接方式包含的外显子;“cell line”显示该基因在这种细胞中特异反向剪接方式(但是检索结果中无法直接下载circRNAs的具体序列,只能下载circRNAs的检索汇总信息);也给出了环状RNA ID,来源基因,对应的线性转录本,表达量,外显子的起始和终止位置,细胞系,保守性等信息。

人类circRNA的注释同时使用CIRCexplorer2及MapSplice 两种程序,并通过LiftOver 分析整合人类及小鼠间circRNA保守性信息。根据每百万map片段上反向剪切接头的map片段数量 (FPM) 来计算circRNA的表达,并同时支持单端及双端测序数据。

输出文件格式包括JSON, XML, CSV, or TXT。下载时可以选择数据来源,同时对人类circRNA搜索结果提供可视化工具(下一步)及GeneCards网站上来源基因的鉴定信息。

02

 Browse

Browse面板的左边提供在染色体该位置上所有的能够鉴定的A3BS、A5BS、circRNA等信息,并通过面板右边可视化体现,包括基因注释、RNA-seq数据集、circRNA注释和备选反向拼接事件,点击具体的图形能够获得详细序列。上方的工具栏中可以切换其他基因组。另外,单击Browse中给定circRNA的track,将对其表达值(FPM)以进行可视化。通过JBowse基因组浏览器查看相关数据,示意如下:

03

Download

Download可修改注释方式表格和物种,轻松下载相应的数据,Table其中A5BS和A3BS数据等待时间需要久点;Species有多个物种可以选择,选择某种cell line下载的话,下载可能会出错,建议选择all,后续再对下载文件进行筛选。

04

 Tool

“Tool”功能可直接对不同circRNAs在不同组织和细胞中表达差异进行分析,主要是用热图或者散点图的形式展现环状RNA在不同组织或者细胞系中的表达量,这有是CIRCpedia v2的一大亮点。一般规定了基因组位置的circRNA,则规定了相应的物种;研究者可选择在不同的组织和细胞中比较表达差异,再以两种图显示出来。操作步骤是第一步输入环状RNA ID, 第二步选择物种,第三步选择细胞系,可以多选,第四步选择图表类型,然后点击Draw按钮,在右边的面板会显示对应的结果。

通过该数据库的在线工具,可以方便的探究不同物种的环状RNA和不同细胞系中环状RNA的表达量。

PS:介于很小比例的人类的circRNA (10%-20%) 同样出现在小鼠样本中,网站整合了LiftOver对两者间circRNA保守性分析的结果,结合Browse可视化工具,可对潜在环化位点附近的内含子序列特征进一步分析。

以上就是本期对CIRCpedia v2数据库的介绍。随着鉴定工具多样化及RNA反向互补序列计算工具的引入,将进一步减少转录组数据预测的假阳性及丰富circRNA的下游分析,因此CIRCpedia v2将来还是很实用的。

(0)

相关推荐

  • 环状RNA在非肿瘤方向的研究

    下面我们分析一下这篇文章的思路: 1.作者收集抑郁病人和正常人样本,提取RNA,进行测定环状RNA的表达量, 2.进行抑郁病人和正常人环状RNA表达的差异分析,选出差异的环状RNA 3.此外,还对三十 ...

  • 4+分干细胞相关的非编码RNA新套路

    大家好,今天和大家分享的是2020年2月发表在Aging(IF=4.831)上的一篇文章:Cancer stem cell-specific expression profiles reveal em ...

  • 科研 | Cell:癌症中环状RNA的全景图

    编译:Tigobin,编辑:十九.江舜尧. 原创微文,欢迎转发转载. 导读 环状RNA(CircRNAs)是一类有趣的RNA,由于其共价封闭结构.高稳定性和在基因调控中的潜在作用而成为一类有趣的RNA ...

  • 环状RNA这么热,你都不想看一下吗

    首先,我们来看一下这篇文章的题目是: Circular RNA MTO1 acts as the sponge of miR-9 to suppress hepatocellular carcinom ...

  • 国人佳作 | Genome Biology:CircAtlas:来自1070个脊椎动物转录组的一百万个高精度环状RNA的整合资源

    编译:热血本能,编辑:十九.江舜尧. 原创微文,欢迎转发转载. 导读 现有的环状RNA(circRNA)数据库已成为转录组学必不可少的.但是,大多数方法都不适合挖掘候选circRNA优先级的深入信息. ...

  • 学徒带你7步3251行代码+300行注释完成TCGA数据库挖掘实战全文复现

    这个春节,因为疫情严重,我老早就想起来应该给学徒们安排任务! 有趣的是,我最不看好的学徒<茄子>率先完成其中一个任务,而且是大大的超出我的预期,让我实在是不敢相信这是一个大四的本科生完成的 ...

  • 使用SnpSift把vcf文件的变异位点注释到clinvar数据库

    遗传变异的数据库注释非常简单,就是从数据库里面下载记录文件,然后根据坐标对应一下即可,甚至很多成熟的工具都可以自动下载数据库以及比对,就跟我们前面讲到的把vcf文件注释到dbSNP数据库的ID一样简单 ...

  • 人类lncRNA的表达数据库

    LncRNA一直是近些年来非编码RNA领域的研究热点,所以,许多各式各样的LncRNA数据库应运而生.今天,小编就来给大家介绍一个通过整合lncRNA在广泛的生物学条件下的表达谱来系统表征人lncRN ...

  • 人类蛋白免疫组化表达数据库

    写在前面 我们在进行基因的蛋白表达检测的时候,通常的方法是进行western blot以及免疫组化进行检测的.对于这两个实验都是需要提前买抗体进行检测的,但是抗体又贵,如果一个基因检测的结果不好的话, ...

  • circRNA数据库的收录、使用及预测分析,生物工程论文

    时间:2019-01-29 来源:中国生物化学与分子生物学报 作者:陈伟,吴仙华,孙绍光 本文字数:12111字 摘    要: 环状RNA (circular RNA, circRNA) 是由真核生 ...

  • circRNA必知数据库

    对于某一类领域的研究而言,总有一些经典的数据库是在开始研究这个领域之前就需要知道的一些数据库.如果要研究circRNA的话,那对于circBase(http://www.circbase.org/)这 ...

  • circRNA相互作用预测数据库

    在前两天介绍circBase的时候,我们统计了一下目前circRNA方面相关的数据库.使用最多的前10的数据库的时候.除了circBase之外还有很多是用来预测circRNA功能的数据库.所以今天.我 ...

  • ANNOVAR人类各个数据库变异注释结果表格说明

    转自 鳉鲈的博客转自:http://www.omicsclass.com/article/464ANNOVAR注释结果中各列的表头说明:ID详解Chr染色体Start变异位点在染色体上的起始位置End ...

  • 最全最细致的circRNA数据库使用指南,学完秒变circRNA研究达人

    CircRNA红透天际,引得一众科学家竞相追逐.然而眼下cirRNA研究的一个巨大挑战就是,可参考信息不多,数据库建设相比其他非编码(miRNA,lncRNA)相对稚嫩. 而数据库使用教程更是稀少,质 ...