circBase 数据库:研究环状RNA,怎能忘记它

# 背景介绍:

环状RNA(circRNA)是一类特殊的非编码RNA分子(在活体中有时也有表达),也是RNA领域最新的研究热点。与传统的线性RNA(linear RNA,含5’和3’末端)不同,circRNA分子呈封闭环状结构,不受RNA外切酶影响,表达更稳定,不易降解。大概在2010年开始,RNA-seq技术的发展以及专门的计算管道开发,引爆了circRNA 研究。

环状RNA的主要类型

近年的研究表明,circRNA分子富含microRNA(miRNA)结合位点,在细胞中起到miRNA海绵( miRNA sponge)的作用,进而解除miRNA对其靶基因的抑制作用,升高靶基因的表达水平;这一作用机制被称为竞争性内源RNA(ceRNA)机制。通过与疾病关联的miRNA相互作用, circRNA在疾病中发挥着重要的调控作用。要开展环状RNA研究,那就不得不介绍这个数据库了~

circBase 数据库

http://www.circbase.org/

circBase 是一个环状RNA的数据库,收录多个物种的circRNA信息,采用了find_circ软件来预测去核糖体文库中的circRNA,数据库可以单个环状和列表形式对环状RNA进行搜索,还可以把全部环状RNA下下来,部署到本地服务器上面,还可以像UCSC一样使用序列进行blat比对,具体功能模块接下来一一介绍。

01

单次搜索可能存在的环状RNA     

在首页搜索框中输入要搜索的内容,可输入的内容格式有:

--circBase标识符

--refseq转录本ID

--基因名称

--genomic coordinates

本次以搜索ZDHHC1为例,输入后点Search

这是出来的结果,有物种信息、基因组上位置,DNA正负链、circRNA 编号、基因组上长度、剪切后长度、检测样本、评分、重复序列、注释、转录本编号、对应基因名称等。Export results中点击可下载结果。

点击position genome browser link后:(表格中蓝色字体的内容可以链接到详细信息)

点击界面左方has_circ_0039826

has_circ_0039827按钮,会打开新的界面

点击View DNA for this teature(hg19/Human) 按钮,进入序列下载界面,按照默认参数,点击get DNA按钮,即可获取所需的circRNA序列信息。

circRNA序列信息包括“genomic”和“spliced”两个选项,分别是基因组上的信息和转录本信息。同时,也可在基因序列上下游增加长度,依据个人需要进行检索和下载即可。

02

list searc     

使用list search可以搜索多个circRNA。在Organism中选好物种,有人、小鼠、线虫等,在list中输入circRNA的名字或者与circRNA相关的基因名或者直接上传文件。

在download中可以下载各物种中的circRNA数据,如果发现自己测序得到的circRNA不在这里面,那有可能就是新发现的circRNA。

在Export results 点击可下载结果(支持xlsx、txtcsv格式),如果要输出环状序列的fa格式的话,点击export fasta,并选择环状剪切的序列;

小tips:

多个环状RNA的选择较好的方式是选择环状RNA剪切长度适中,适合后面进行QPCR验证的,长度小于2000可能会好点,其次,选择比较多样品支持和scores比较多reads mapped上的;

circBase数据库是用到的基因组版本是hg19,但是在实际研究过程中发现circBase提供的位置信息在基因组上面是减1的,所以,从circBase上获得的环状RNA位置信息对应到基因组上,就要加1。

03

table browser    

在table browser,circBase提供了更加灵活的筛选策略用户可以筛选各种条件,检索框示意如下:

04

blat

通过blat模块,可以输入fasta格式的查询序列,然后和数据库中的circRNA序列进行比较,,用于了解基因的物种保守性。

提交时要按顺序粘贴。如果序列为fasta格式,则可以一次提交多个序列(每个序列的标题行均以>开头,并包含序列的名称)

04

物种序列下载     

做组学研究需要整个物种的circRNAs序列信息的时候,可以再导航栏点击”downloads“项进行选择,找到对应的物种,点击下载即可。

以上就是circbase中基本的、最常用的查询和检索使用方法,实际操作中也非常有用,如果想研究circRNAs,这个网站绝对是您的第一选择。

(0)

相关推荐