最强攻略4:史上最全甲基化表观调控数据库汇总解读

表观遗传(Epigenetics)是指DNA序列未发生变化,但基因的表达却发生了可遗传改变。表观遗传学是指基于非基因序列改变所致基因表达水平变化,如DNA甲基化和染色质构象变化等;表观基因组学(epigenomics) 则是在基因组水平上对表观遗传学改变的研究。

表观遗传改变主要从四个层面调控基因表达:

(1)DNA甲基化:DNA共价结合甲基基团,使相同序列等位基因处于不同修饰状态;
(2)组蛋白修饰:通过对结合DNA的组蛋白进行不同的化学修饰实现对基因表达的调控;
(3)染色质重塑:通过改变染色质的空间构象实现对基因表达的调控;
(4)非编码RNA的调控:RNA可通过某些机制实现对基因转录和转录后的调控。

今天所要汇总介绍的就是DNA甲基化数据库。甲基化(methylation)是蛋白质和核酸的一种重要的修饰,能够调节基因的表达和关闭,与癌症、衰老、老年痴呆等许多疾病密切相关,是表观遗传学的重要研究内容之一。而DNA甲基化是DNA化学修饰的一种形式,是DNA序列上特定的碱基在DNA甲基转移酶(DNMT)的催化作用下,以S-腺苷甲硫氨酸(SAM)作为甲基供体,通过共价结合的方式获得一个甲基基团的化学修饰过程。话不多说,来看看甲基化数据库有哪些吧!

01

RMBase

http://rna.sysu.edu.cn/rmbase/

RMBase 简单来说是一个RNA水平表观遗传修饰查询的数据库,用于整合转录组测序数据,以探索RNA的转录后修饰,可以查询疾病相关SNP和RNA结合蛋白(RBP)的关系。该数据库由屈良鹄教授实验室构建。里面有13个物种的47个研究中的566个数据集和1 397 244个修饰位点,m 6 A、m 5 C、2'-O-Me和100种其他类型的修饰物。

详情请戳:RMBase:RNA甲基化修饰数据库

02

RMVar

http://rmvar.renlab.org/

RMVar数据库主要是收集了影响m6A修饰的相关变异,也整合了与变异相关的RBP结合区、miRNA-靶点和剪接位点,以帮助用户研究m6A相关变异对转录后调控的影响。库内收录的修饰物包括m 6 Am,m 1 A,ψ,m 5 C,2'-O-Me和m 7 G,5-甲基尿苷m5U,A至I。还整合了来自全基因组关联研究(GWAS)和ClinVar的数据,所以m6AVar也可为研究m6A相关变异和疾病间的关系提供支持。

详情请戳:RMVar:m6A修饰相关甲基化数据库

03

m6A-Atlas

http://180.208.58.66/m6A-Atlas/

m6A-Atlas是专门用于解读m6A表观遗传组,m6A-Atlas具有可靠的m 6 A位点和定量表观转录组谱的高可信度集合。提供了保护,转录后机制的位点,假定的生物学功能和单个m 6 A位点的疾病关联以及感染过程中宿主和病毒的转录组。

详情请戳:m6A-Atlas:m6A甲基化综合型数据库

04

SRAMP

http://www.cuilab.cn/sramp

SRAMP数据库主要是用作预测目标RNA序列上m6A修饰位点,也是用来预测哺乳动物m6A修饰位点的数据库。SRAMP运行预测时仅需要RNA序列,而无需加载外部组学数据。在lncRNA、circRNA等测序数据不充足的条件下,也是一个有力的m6A位点分析工具。

详情请戳:SRAMP:哺乳动物m6A修饰位点数据库

05

EWAS Data Hub

https://bigd.big.ac.cn/ewas/datahub

EWAS Data Hub有75 344个样本的DNA甲基化阵列数据,并采用有效的归一化方法来消除不同数据集之间的批量影响。EWAS数据中心能提供不同背景下的参考DNA甲基化图谱,涉及81种组织/细胞类型(包含25个脑部和25种血细胞类型),6个祖先类别和67种疾病(包括39种癌症)。EWAS Data Hub 还提供了高效的查询方式,可协助检索和发现基于甲基化的生物标记物。

详情请戳:EWAS Data Hub:DNA甲基化芯片数据库

06

iMETHYL

http://imethyl.iwate-megabank.org/index.html

iMETHYL是一个DNA甲基化、 SNP和RNA_seq的多组学联合数据库。库内提供CD4 + T淋巴细胞,单核细胞和嗜中性粒细胞的全DNA甲基化(〜2400万个常染色体CpG位点),全基因组(〜900万个单核苷酸变体)和全转录组(> 14000个基因)数据。通过提供多组学数据和QTL信息,整合SNP, DNA甲基化和RNA表达谱的数据,进行两两之间的关联分析,iMETHYL将用作综合参考数据,帮助研究人员推断DNA甲基化,基因组变异和基因表达之间的调控机制。

详情请戳:iMETHYL:DNA甲基化、 SNP和RNA_seq的多组学联合数据库

07

MethBank

http://bigd.big.ac.cn/methbank

MethBank是一个非常全面的甲基化数据库,集成了各种物种的共有参考甲基化组(CRM),全基因组单碱基分辨率甲基化组(SRM),DNA和RNA甲基化工具(MeTools)以及表观基因组范围关联研究(EWAS),并提供了甲基化数据可视化的交互式浏览器。数据库以高质量甲基化酶大规模整合为特色,涉及34个来自大量人类样品的共识参考甲基化组织,336个来自不同发育阶段5个植物组织的单碱基分辨率甲基化组织,18个单碱基在人类和小鼠的多个阶段从配子和早期胚胎中分辨甲基化组织。

详情请戳:MethBank:单细胞甲基化数据库

08

Pubmeth

http://www.pubmeth.org/

Pubmeth是一个整理癌症相关甲基化数据库,收集和整理了文献中与癌症相关的甲基化数据,并进行了人工校对和注释,提供了一个高质量的癌症相关的发生了甲基化基因的数据库。PubMeth包含5000多个记录,这些记录来自1000多个文献来源。

详情请戳:Pubmeth:癌症相关甲基化数据库

09

SurvivalMeth

http://bio-bigdata.hrbmu.edu.cn/survivalmeth/

SurvivalMeth主要是提供癌症相关甲基化预后的信息。它收集了36种癌症的DNA甲基化谱,整合单个DMFE、多个DMFE、SEs和临床数据,对预上传数据进行生存分析,还允许上传来自各种疾病的DMFE的定制DNA甲基化图谱进行分析。SurvivalMeth为预后DMFEs提供了全面的资源和自动化分析,包括DMFE甲基化水平、相关分析、临床分析、差异分析、DMFE注释、生存相关详细结果和生存分析可视化。

详情请戳:SurvivalMeth:甲基化预后分析专用数据库

10

MethSurv

https://biit.cs.ut.ee/methsurv/

MethSurv是一个基于CpG甲基化模式进行生存分析的网络工具,有25种不同人类癌症的7358个甲基化数据,使用了Cox比例风险模型开发了用于生存分析的交互式网络工具。MethSurv能够对位于查询基因附近或附近的CpG进行生存分析,还可以提供对查询基因的聚类分析,以将甲基化模式与临床特征相关联,并筛选出每种癌症类型的主要生物标志物。对于不会编程的科研人员来说,MethSurv工具是一个十分有用平台,可以对基于甲基化的癌症生物标记物进行初步筛选评估,在几秒钟内生成分析结果,对甲基化研究带来很多便利。

详情请戳:MethSurv:TCGA甲基化分析工具

11

MethyCancer

http://methycancer.psych.ac.cn/

MethyCancer主要是用于研究DNA甲基化、基因表达与癌症之间的相互作用,以及人类基因中CGI的分布,启动子CGI中DNA甲基化模式的改变。鉴定仅通过DNA甲基化或与遗传事件结合而改变的新癌症基因,以及发现新的表观遗传的目标。它包含来自公共资源的高度集成的DNA甲基化数据,癌症相关基因,突变和癌症信息,以及来自我们大规模测序的CpG Island(CGI)克隆。可以在基因组和遗传数据的背景下查看DNA甲基化。

详情请戳:MethyCancer:癌症相关甲基化基因数据库

12

DiseaseMeth

http://bio-bigdata.hrbmu.edu.cn/diseasemeth/

DiseaseMeth 是一个专注于人类疾病的异常甲基化数据库,不仅包括多种癌症,同时还包括神经发育和退行性疾病、自身免疫疾病等数据集。通过人工搜索了近些年文献报道的新异常甲基化基因,32701甲基化谱样本数,88种疾病,679602对甲基化相关的疾病基因关系。数据库还提供了三个新的在线工具用于聚类分析,功能注释或者生存分析。

详情请戳:DiseaseMeth:人类疾病甲基化数据库

END

撰文丨赛赛
排版丨西西
值班 | 小太阳
主编丨司马牧野
(0)

相关推荐