甲基化信号值的差异分析也许不应该是看logFC

有意思的是,甲基化分析其实和普通的mRNA表达矩阵分析有很多概念问题是无法迁移的,包括质量控制,WGCNA分析,哪怕是简单的差异分析都有区别。

标准差异分析系列教程

虽然说拿到甲基化信号值矩阵后,仍然是可以走标准分析流程,火山图,热图,GO/KEGG数据库注释等等。这些流程的视频教程都在B站和GitHub了,目录如下:

  • 第一讲:GEO,表达芯片与R

  • 第二讲:从GEO下载数据得到表达量矩阵

  • 第三讲:对表达量矩阵用GSEA软件做分析

  • 第四讲:根据分组信息做差异分析

  • 第五讲:对差异基因结果做GO/KEGG超几何分布检验富集分析

  • 第六讲:指定基因分组boxplot指定基因list画热图

感兴趣可以细读表达芯片的公共数据库挖掘系列推文 ;

但是差异分析大家还是首先limma,而limma这个包本来是针对log后的表达矩阵设计的,这样的话,如果我们的输入是甲基化信号矩阵,实际上出来的结果是有问题的。

甲基化信号值的生物学意义

首先甲基化信号值通常是贝塔值,是介于0到1之间的连续变量。

公式计算:平均β=信号B /(信号A +信号B + 100)
通过计算甲基化(信号A)和未甲基化(信号B)等位基因之间的强度比来确定DNA甲基化水平(β值)。
具体地,β值是由甲基化(M对应于信号A)和未甲基化(U对应于信号B)等位基因的强度计算的,荧光信号的比率β= Max(M,0)/ [Max( M,0)+ Max(U,0)+ 100]
因此,β值的范围从0(完全未甲基化)到1(完全甲基化)

一般来说,具体的β值的意义是:

  • 任何等于或大于0.6的β值都被认为是完全甲基化的。

  • 任何等于或小于0.2的β值被认为是完全未甲基化的。

  • β值在0.2和0.6之间被认为是部分甲基化的。

差异分析的问题所在

我发现发表在Mol Med Rep. 2019 Jul; 的文章doi: 10.3892/mmr.2019.10294 就提到了对甲基化信号矩阵做差异分析后,选取什么样的阈值来判定是统计学显著的高甲基化位点或者低甲基化位点,如下:

这个log2FC看得我心疼,都0.1了。

仔细看了看,其实研究者走完limma流程之后呢,其实是把全部的logFC值给画了density图,才决定使用什么样的阈值。听起来还蛮有统计学道理的!

亲爱的读者,你觉得呢?

甲基化信号矩阵差异分析免费做

我们推文里面提到的各种各样的数据分析环节都是我非常有经验的,比如我在lncRNA的一些基础知识 ,和lncRNA芯片的一般分析流程 介绍过的那些图表,以及下面的目录的分析内容 对我来说是举手之劳,希望可以帮助到你!

同样的,本次活动我可以帮你免费做一次甲基化信号矩阵差异分析,但是呢,我也没办法保证结果咋样,有时候数据集就是这样。而且,你需要挑选一下你的阈值哦!

还是老规矩,发送数据分析要求,以及简短的项目描述到我的邮箱 jmzeng1314@163.com

邮件正文最好是加上你是啥时候认识生信技能树的哦,或者其它一些寒暄的话,自我介绍也行。主要是考虑到可能想免费分析数据的朋友很多,所以会根据你的来信,我主观判定一个优先级哦。目前我有20多个愿意长期在我的指导下进行数据探索的学徒,等我的团队扩大到200人,我们应该是可以做到数据分析全部免费,敬请期待哈!

(0)

相关推荐

  • 差异分析|DESeq2完成配对样本的差异分析

    本文为群中小伙伴进行的一次差异分析探索的记录. 前段时间拿到一个RNA-seq测序数据(病人的癌和癌旁样本,共5对)及公司做的差异分析结果(1200+差异基因),公司告知用的是配对样本的DESeq分析 ...

  • 甲基化信号值矩阵差异分析主要图表

    差异分析永远是最平易近人的策略,我们前面整理的各种系列教程,miRNA的,lncRNA的,mRNA芯片或者测序,circRNA系列的,都会得到表达矩阵,然后走差异分析.只不过是不同统计学分布的表达矩阵 ...

  • 甲基化信号值矩阵差异分析哪家强

    前面我们介绍了一些背景知识,主要是理解什么是DNA甲基化,为什么要检测它,以及芯片和测序两个方向的DNA甲基化检测技术.具体介绍在:甲基化的一些基础知识,也了解了甲基化芯片的一般分析流程 . 但是我留 ...

  • EpiDISH-根据甲基化信号值推断样品的细胞成分

    传统的甲基化信号值通常是芯片,比如illumina公司的27K,450K,850K的甲基化芯片,它们检查的通常是细胞混合物,比如绝大部分肿瘤组织样品其实是混合了上皮细胞,基质细胞和免疫细胞.如果我们感 ...

  • 根据甲基化探针信号值把样本分成CIMP组

    看到文章 PLoS Genet. 2016 ,提到了 CpG island methylator phenotype (CIMP) subtype 分组的细节 Methylation datasets ...

  • 850K甲基化芯片的TSS附近信号值曲线绘制

    本来呢,这应该是一个教程,但最近是过年休假期间,我也不能无限制的回答粉丝提问,所以借<生信技能树>的便利给他发一个有偿求图的的宣传: 很可惜,我没有现成代码,所以无法"举手之劳& ...

  • BRCA的甲基化信号分型(逆向收费读文献2019-11)赠送一篇文章思路

    栏目起源 逆向收费读文献社群 (2018-01-07) 逆向收费读文献社群 (2018-06-09) 逆向收费读文献社群(第二年通知)(2019-01-26) 大概有50人加入吧,成功坚持下来的朋友们 ...

  • 使用DSS包多种方式检验差异甲基化信号区域

    因为一个有趣的原因,我们来一起学一个R包吧 一个背景 哺乳动物基因组CpG位点通常集中在称为CpG岛(CpG island,CGI)的区域中,并且已知人基因启动子~60%含有CpG岛.CpG岛上下游不 ...

  • 黄建南的这幅画为什么值四千六百万?是普通人看不懂艺术吗?

    写生帮2021-05-03 17:23:52 黄建南擅长油画.禅意国画.陶瓷画,其作品多次参加国内外各种展览.多次接受中央电视台.北京电视台.山东电视台.河北电视台等艺术栏目专题采访播出. 他作为当今 ...

  • 检验科危急值如何管理?检验人必看!

    来源:临床检验医学 一.什么是危急值? 危急值是指对提示患者处于生命危急状态的检查.检验结果建立复核.报告.记录等管理机制,以保障患者安全的制度. 二.处理危急值的基本要求 1.医疗机构应当分别建立住 ...