这一个图背后是12个差异分析的综合

一个看似很复杂的项目

今天我们分享其中一个数据分析委托任务,粉丝来信是给我一个参考文献,想在LUSC里面重复下面这个LUAD结果。

 

这个图对我来说很简单,但是我拒绝了, 因为我是免费分析数据,但是对方非常的不礼貌,给一个文献,然后就颐指气使的激将我,怀疑我的能力,具体来信内容我就不发出来了。

让我们看看这个看起来内容很充实的图到底有多简单吧!

首先拿到表达矩阵

同样的我们推荐是UCSC的XENA浏览器直接下载,这里可能是需要区分一下mRNA和lncRNA,然后根据表达量进行过滤。如下;

Among the LUAD datasets, expression data for 19,669 mRNAs, 7,309 lncRNAs, and 1,882 miRNAs were extracted from TCGA and analyzed with R package (DESeq2).

12次DESeq2差异分析

这里把LUAD病人分成了4类,是一个临床表型,就是stage啦,这样的话就是3*4=12个表达矩阵,12次差异分析。我们写代码其实就是一个循环罢了,可能就是这么多分析对计算资源时长消耗很严重。

In this analysis, we compared adjacent normal lung tissue with lung cancer subtypes defined by pathology stage (T1-T4), respectively.

最后绘制韦恩图

主要是选择好阈值,比如 FC < 2, FDR < 0.01就可以判断统计学显著的差异分子(mRNA和lncRNA,miRNA)啦

When we combined these four groups and analyzed for DE RNAs, 2,160 mRNAs (1,527 up- and 1,083 down-regulated), 915 lncRNAs(662 up- and 253 down-regulated), and 125 miRNAs (73 up- and 52 down-regulated) showed consistently differential expression (FC < 2, FDR < 0.01)

假如这个项目委托你

你会如何定价,假如你恰好有这样的需求,你愿意出多少钱呢?

免费的数据分析活动

我们推文里面提到的各种各样的数据分析环节都是我非常有经验的,比如我在lncRNA的一些基础知识 ,和lncRNA芯片的一般分析流程 介绍过的那些图表,以及下面的目录的分析内容 对我来说是举手之劳,希望可以帮助到你!

还是老规矩,发送数据分析要求,以及简短的项目描述到我的邮箱 jmzeng1314@163.com 目前只接受邮件这个交流形式,谢谢合作,麻烦用心一点写!

邮件正文最好是加上你是啥时候认识生信技能树的哦,或者其它一些寒暄的话,自我介绍也行。主要是考虑到可能想免费分析数据的朋友很多,所以会根据你的来信,我主观判定一个优先级哦。目前我有20多个愿意长期在我的指导下进行数据探索的学徒,等我的团队扩大到200人,我们应该是可以做到数据分析全部免费,敬请期待哈!

其它学徒作业

学徒不仅仅是在我这里学生物信息学相关知识,更重要的是能够筛选极少部分同样热爱知识整理和分享的小伙伴,所以我继续安排了一些学徒作业题

如果看到这些习题的你也感兴趣加入我们的在线学徒列表,欢迎随机挑选一个作业尝试完成后,邮件汇报给我你探索的过程!我的邮箱 jmzeng1314@163.com

这个甲基化数据分析不免费了

因为分析起来的确很耗费计算机资源

(0)

相关推荐