甲基化信号值矩阵差异分析主要图表

差异分析永远是最平易近人的策略,我们前面整理的各种系列教程,miRNA的,lncRNA的,mRNA芯片或者测序,circRNA系列的,都会得到表达矩阵,然后走差异分析。只不过是不同统计学分布的表达矩阵,后续使用不同R包而已,得到的差异分析结果的解释又取决于生物学背景,是否了解circRNA等分子。

同理,我们前面教程:450K芯片上面的甲基化探针到底需要进行哪些过滤 已经强调过了甲基化芯片数据分析的一些注意事项,以及标准代码,共享了大量的学习资料。现在一起来看看甲基化信号值矩阵差异分析主要图表吧,这样你拿到了我的标准代码,处理好你的数据后,也可以简单快速理解它。

主要图

以 Genome-wide DNA methylation profiling reveals novel epigenetic signatures in squamous cell lung cancer 文章为例子:

统计学显著的差异甲基化探针数量

首先450K芯片,过滤后剩下371K甲基化探针位点,然后1%是具有统计学显著的差异甲基化探针,如下:

image-20200208234720159

文章描述:

After normalization, 371,000 probes from the methylation array were retained for analysis. Using the criteria of FDR p-value <0.05 and β difference ≥ 0.2, we identified 5214 probes (1771 gene) differentially methylated. Among them, 4001 probes (77%) were significantly hypermethylated, and 1213 probes (23%) were significantly hypomethylated in tu- mors (Fig. 1a).

一般来说,如果你走的champ流程,40万探针其实会拿到十多万差异的,但是有一个 β difference ≥ 0.2就可以筛到一千个左右的位点啦!

代码已经非常简单了,就是去GEO数据库你的数据集把矩阵下载下来,读入R,加上临床信息然后走下面的代码

# 下面的beta.m是甲基化矩阵,pD 是表型信息
myLoad=champ.filter(beta = beta.m ,pd = pD)  
myNorm <- champ.norm(beta=myLoad$beta,arraytype="450K",cores=5) 
group_list=myLoad$pd$group 
myDMP <- champ.DMP(beta = myNorm,pheno=group_list)

差异甲基化探针信号值矩阵热图

前面的差异分析,比如那篇文章,拿到了5214 probes ,取信号值矩阵绘制热图如下:

b Two-dimensional hierarchical clustering was performed using the 5214 variable DNA methylation probes across all samples (n = 48).

image-20200208234920752

当然了,这个热图绘制的丑爆了哦。

差异甲基化探针注释

位于基因组不同功能区域的甲基化探针信号值代表的生物学意义不一样,包括5’ UTR, first exon, gene body, 3’ UTR, CpG island, CpG shore, CpG shelf,这些注释,都是在厂商提供注释文件信息里面。所以差异分析拿到的高甲基化或者低甲基化位点就可以分类。

image-20200208235028074

这些分类,其实champ包给你做完差异分析的时候,也是自动加水了,比如作者就是仅仅拿Excel表格画了个饼图。

GO或者KEGG等数据库功能注释

这个需要注意的是你不一定是对全部的差异甲基化位点所在的基因一窝蜂的拿去注释,首先,七千多个探针对应的基因仍然是好几千,这样的数量注释的意义不大。可以按照上面的分类,比如5’ UTR, first exon, gene body, 3’ UTR, CpG island, CpG shore, CpG shelf,这些地方的基因分开注释,拿到并行富集结果。

image-20200209162511669

当然了,仍然是普通的超几何分布检验,至于这个图如何理解,就要结合统计学知识和生物学背景了。

主要表格

表格其实就是上面图的原始数据而已。

不知道你有没有推荐的好的甲基化文献,把简单的差异分析玩出花的呢?欢迎进入我们的甲基化交流群,或者留言推荐哈。

文末友情宣传

强烈建议你推荐给身边的博士后以及年轻生物学PI,多一点数据认知,让他们的科研上一个台阶:

(0)

相关推荐

  • 甲基化套路

    和甲基化有关的. 可以先了解下甲基化: 450k甲基化基础 450K甲基化芯片数据处理传送门 450k甲基化芯片常用工具包:ChAMP和minfi等. 甲基化的一些预备知识 甲基化程度的量化 imag ...

  • 学一学DNA甲基化芯片分析流程

    今天是生信星球陪你的第778天 大神一句话,菜鸟跑半年.我不是大神,但我可以缩短你走弯路的半年~ 就像歌儿唱的那样,如果你不知道该往哪儿走,就留在这学点生信好不好~ 这里有豆豆和花花的学习历程,从新手 ...

  • MethSurv:TCGA甲基化分析工具

    导语 DNA甲基化是当前研究最多的表观遗传修饰,对于促进胚胎发育,基因组印记和X染色体失活等重要生物过程至关重要.在甲基化研究的技术手段中,HM450K芯片在癌症甲基化组数据集中占主导地位.TCGA数 ...

  • ​SurvivalMeth:甲基化预后分析专用数据库

    今天介绍一个特别的甲基化数据库:SurvivalMeth.SurvivalMeth是一个研究DNA甲基化对预后影响的新型数据库,由哈尔滨医科大学李霞教授团队开发,2020年8月份上线.数据库包含来自T ...

  • 甲基化信号值矩阵差异分析哪家强

    前面我们介绍了一些背景知识,主要是理解什么是DNA甲基化,为什么要检测它,以及芯片和测序两个方向的DNA甲基化检测技术.具体介绍在:甲基化的一些基础知识,也了解了甲基化芯片的一般分析流程 . 但是我留 ...

  • 甲基化信号值的差异分析也许不应该是看logFC

    甲基化的一些基础知识 甲基化芯片的一般分析流程 有意思的是,甲基化分析其实和普通的mRNA表达矩阵分析有很多概念问题是无法迁移的,包括质量控制,WGCNA分析,哪怕是简单的差异分析都有区别. 标准差异 ...

  • EpiDISH-根据甲基化信号值推断样品的细胞成分

    传统的甲基化信号值通常是芯片,比如illumina公司的27K,450K,850K的甲基化芯片,它们检查的通常是细胞混合物,比如绝大部分肿瘤组织样品其实是混合了上皮细胞,基质细胞和免疫细胞.如果我们感 ...

  • 根据甲基化探针信号值把样本分成CIMP组

    看到文章 PLoS Genet. 2016 ,提到了 CpG island methylator phenotype (CIMP) subtype 分组的细节 Methylation datasets ...

  • 850K甲基化芯片的TSS附近信号值曲线绘制

    本来呢,这应该是一个教程,但最近是过年休假期间,我也不能无限制的回答粉丝提问,所以借<生信技能树>的便利给他发一个有偿求图的的宣传: 很可惜,我没有现成代码,所以无法"举手之劳& ...

  • BRCA的甲基化信号分型(逆向收费读文献2019-11)赠送一篇文章思路

    栏目起源 逆向收费读文献社群 (2018-01-07) 逆向收费读文献社群 (2018-06-09) 逆向收费读文献社群(第二年通知)(2019-01-26) 大概有50人加入吧,成功坚持下来的朋友们 ...

  • limma和edgeR对RNA-seq表达矩阵差异分析的区别

    前面我们在生信技能树系统性介绍了大量RNA-seq相关背景知识,以及表达矩阵分析的一般流程 RNA-seq这十年(3万字长文综述) RNA-seq的counts值,RPM, RPKM, FPKM, T ...

  • 使用DSS包多种方式检验差异甲基化信号区域

    因为一个有趣的原因,我们来一起学一个R包吧 一个背景 哺乳动物基因组CpG位点通常集中在称为CpG岛(CpG island,CGI)的区域中,并且已知人基因启动子~60%含有CpG岛.CpG岛上下游不 ...

  • 奇门遁甲 | 九星值时克应图表

    在奇门遁甲演算中 天盘九星法属于数理奇门 中华先祖认为星宿作为参照 可以推算地球上的气象物候和人心背向 故而成为帝王之术 九星的运行规律对人类的身心 早已打上了时空烙印 如果 你想通过九星推算系统 了 ...