文献解读 | Diana-lncbase v3:用实验支持的miRNA靶标

论文:DIANA-LncBase v3: indexing experimentally supported miRNA targets on non-coding transcripts | Nucleic Acids Research | Oxford Academic(Diana-lncbase v3:用实验支持的miRNA靶标)

摘要

DIANA-LncBase v3.0 (www.microrna.gr/LncBase)是一个参考储存库,在非编码转录本上有实验支持的miRNA目标。它的第三个版本提供了大约50万个条目,对应于∼24万独特的组织和细胞类型的特定miRNA-incRNA对。

这种相互作用的汇编来自于对出版物的手工管理和对>300个高吞吐量数据集的分析。MiRNA靶点由14种实验方法支持,应用于人和小鼠243种不同的细胞类型和组织。数据库中最大的部分是高度自信的,前剪辑衍生的miRNA绑定事件。

LncBasev3.0是第一个采用稳健的剪贴画引导算法(Microclip)的相关数据库,用于分析236个∼剪贴画库和目录中的37万个miRNA绑定事件。数据库是从头开始重新设计的,提供了新的功能。已知的短变异信息,在>67,000个实验支持的目标位点和不同细胞间隔中的INcRNA表达谱为用户服务。

交互式可视化图,描绘了miRNA-INcRNA对的相关性,以及INcRNA在广泛的细胞类型和组织中的表达谱,是第一次通过一个专门的页面展示。LncBasev3.0是ncRNA研究的宝贵资产,为理解尚未被广泛探索的INcRNA功能提供了新的见解。

数据库统计

Dia-LncBasev3.0索引了大约50万条条目,对应于实验支持的细胞类型和组织特异性miRNA-INcRNA相互作用的最大集合。结合的相互作用是由14种不同的低产量和高通量方法定义的,对应于192种细胞类型、52种组织和162种实验条件。

>730个miRNA-incRNA条目被手工策划,2094个相互作用被从miRNA特异性转染/敲除微阵列实验的重新分析中提取出来。

数据库内容的最大部分归因于由前剪辑衍生的miRNA绑定事件.LncBasev3.0包含了2924个miRNA-incRNA嵌合片段,而>235000个交互作用已经从236位前的剪辑-Seq数据集的重新分析中检索出来,并且使用了一个健壮的剪辑-Seq引导算法。

从直接高通量技术中检索到的每个组织和mirna物种的mirna-incRNA相互作用的数量,以及在不同incrna类别中相互作用的分布,如图所示。1A。

85±10%的miRNA靶点被划分为主要的INcRNA类(正义、反义、基因间)和假基因。图中总结了来自不同方法的最新mirna-incRNA对。1B.

实验支持的交互作用模块

用户可以通过以下方式检索交互:(I)使用miRNA和/或基因名称执行查询--从Ensembl(51),miRBase(29),RefSeq(33)和卡比利等人 (34(Ii)采用不同的筛选标准组合,包括种类、细胞类型/组织和方法;(Iii)在INcRNA转录本上寻找特定的基因组位置,以确定是否存在MRES。

过滤选项也得到了增强,为用户提供了一系列可能的过滤组合(图)。2)。MiRNA置信度指示,由最新版本的miRBase和已知的关于MRE区域的短期变异信息,是补充检索结果的新特征,也是过滤器。

有用的变体元信息,即外部标识符、等位基因、确切的变异位置以及与原始源的链接,将在适用的情况下提供。每一个mirna-incRNA相互作用的miRNA结合事件,再加上mre重叠的变异基因组位置,随后可以在交互式的ucsc基因组浏览器中显示(52)图形,用户可以利用UCSC团队提供的所有浏览器选项和集成在其中的资源。

INcRNA表达谱模块

可以通过实验支持的交互模块中的一个相互连接的链接来探索incRNA的表达,或者在incRNA表达的专用结果页面中应用一个或多个ncRNA转录本的查询。

使用者可以检索细胞内的incRNAs(I)的表达谱(“表达”模式)和(Ii)在细胞核和细胞质亚细胞间隔(“定位”模式)之间的相对表达谱(“定位”模式),在人类和小鼠物种中可以检索到广泛的细胞类型。描述INcRNA表达的TPM值提供给用户。

如果有多个生物复制,则指定中间值TPM值。具体来说,在“表达式”模式下,用户还可以通过选择一个特定的TPM值范围来检索结果,TPM值被描述为“低”(范围:1-10)、“中等”(范围:11-600)和“高”(范围:>600)。

在“定位”模式下,TPM值分别在细胞核和细胞质中估计,然后是RCI值和INcRNA亚定位的明显倾向,无论是向核还是向细胞质。用户还可以通过与实验支持的目标的模块相互连接的专用链接检索指定的incRNAs的目标(图)。3).

高级可视化

Dia-LncBasev3.0还提供了交互式可视化绘图,使用D3.jsJavaScript库实现。用户可以通过交互相关图来探索mirna-incRNA相互作用的可能聚类,这种聚类可以通过剪贴器-seq方法在不同的细胞类型和组织中检索到(图)。4)。

还提供了交互式条形图,描述了在细胞内和/或在不同细胞类型之间的不同亚细胞间隔中的incRNA表达谱(图)。5).

截图描绘DIANA-LncBase v3.0交互式相关情节。使用者可以选择一个以上的细胞类型和/或组织,以探索他们的关系,基于缺乏/存在的AG-剪裁-Seq衍生的miRNA-incRNA相互作用。

对于每一对组合,计算了Pearson的r系数值.当前的图表描述了在LncBasev3.0中所有人类细胞类型之间的相关性。淋巴母细胞、骨髓来源细胞和乳腺细胞系等细胞类型之间存在较高的相关性。

截图描绘戴安娜-LncBase v3.0互动条形图。用户可以选择INcRNA,并可选择细胞类型(组织)来查看其表达概况(A)及其在核细胞质室中的丰度(B)。

当前条形图描绘MALAT 1表达式。TPM值和RCI值分别绘制在‘INcRNA表达’图(A)和‘细胞核/细胞质INcRNA亚定位’图(B)中。

负RCI值和正RCI值分别表示INcRNA表达倾向于细胞核和细胞质。用户可以通过相互连接的交互表(B)将RCI值与核/细胞质INcRNA表达谱相结合。

结语

IncRNAs似乎参与了许多生理和病理过程,因而逐渐成为研究的热点。它们与miRNAs的相互作用及其在组织和疾病特定环境中相互竞争的内源性相互作用中的突出作用,创造了一个不断发展的研究领域。

近几年来,人们提出了miRNA-INcRNA相互作用的索引方法.LncBasev3.0展示了自上一版本以来,通过索引∼24万组织特异性和实验支持的miRNA-INcRNA相互作用所取得的增量改进。

利用微CLIP算法分析AGO-CL-Seq数据提供了高度自信的miRNA结合事件.INcRNA的表达谱及其亚细胞定位信息可能是进一步了解INcRNA功能的关键。LncBasev3.0是研究界的重要资产,为理解ncRNA调控功能开辟了新的可能性。


欢迎微信关注【非编码RNA研究园地】,我们致力于及时发布医学科研前沿进展,帮助医务工作者开拓思路,从专业角度解答课题基金及SCI相关问题,助力学术成果转化。

(0)

相关推荐