这一个图背后是12个差异分析的综合
一个看似很复杂的项目
今天我们分享其中一个数据分析委托任务,粉丝来信是给我一个参考文献,想在LUSC里面重复下面这个LUAD结果。

这个图对我来说很简单,但是我拒绝了, 因为我是免费分析数据,但是对方非常的不礼貌,给一个文献,然后就颐指气使的激将我,怀疑我的能力,具体来信内容我就不发出来了。
让我们看看这个看起来内容很充实的图到底有多简单吧!
首先拿到表达矩阵
同样的我们推荐是UCSC的XENA浏览器直接下载,这里可能是需要区分一下mRNA和lncRNA,然后根据表达量进行过滤。如下;
Among the LUAD datasets, expression data for 19,669 mRNAs, 7,309 lncRNAs, and 1,882 miRNAs were extracted from TCGA and analyzed with R package (DESeq2).
12次DESeq2差异分析
这里把LUAD病人分成了4类,是一个临床表型,就是stage啦,这样的话就是3*4=12个表达矩阵,12次差异分析。我们写代码其实就是一个循环罢了,可能就是这么多分析对计算资源时长消耗很严重。
In this analysis, we compared adjacent normal lung tissue with lung cancer subtypes defined by pathology stage (T1-T4), respectively.
最后绘制韦恩图
主要是选择好阈值,比如 FC < 2, FDR < 0.01就可以判断统计学显著的差异分子(mRNA和lncRNA,miRNA)啦
When we combined these four groups and analyzed for DE RNAs, 2,160 mRNAs (1,527 up- and 1,083 down-regulated), 915 lncRNAs(662 up- and 253 down-regulated), and 125 miRNAs (73 up- and 52 down-regulated) showed consistently differential expression (FC < 2, FDR < 0.01)
假如这个项目委托你
你会如何定价,假如你恰好有这样的需求,你愿意出多少钱呢?
免费的数据分析活动
我们推文里面提到的各种各样的数据分析环节都是我非常有经验的,比如我在lncRNA的一些基础知识 ,和lncRNA芯片的一般分析流程 介绍过的那些图表,以及下面的目录的分析内容 对我来说是举手之劳,希望可以帮助到你!
转录组数据分析的4个维度认识(数据分析继续免费哦) RNA-seq数据的2个分组差异分析,热图,PCA图,火山图等等
根据感兴趣基因看肝癌免疫微环境的T细胞亚群差异 条形图或者箱线图
查看感兴趣基因的甲基化水平和RNA表达水平(数据分析免费做)相关性 散点图或者箱线图
log与否会改变rpkm形式表达矩阵top的mad基因列表 WGCNA分析免费做
甲基化信号值的差异分析也许不应该是看logFC 甲基化信号矩阵差异分析免费做
WGCNA得到模块之后如何筛选模块里面的hub基因 WGCNA分析免费做
还是老规矩,发送数据分析要求,以及简短的项目描述到我的邮箱 jmzeng1314@163.com 目前只接受邮件这个交流形式,谢谢合作,麻烦用心一点写!
邮件正文最好是加上你是啥时候认识生信技能树的哦,或者其它一些寒暄的话,自我介绍也行。主要是考虑到可能想免费分析数据的朋友很多,所以会根据你的来信,我主观判定一个优先级哦。目前我有20多个愿意长期在我的指导下进行数据探索的学徒,等我的团队扩大到200人,我们应该是可以做到数据分析全部免费,敬请期待哈!
其它学徒作业
学徒不仅仅是在我这里学生物信息学相关知识,更重要的是能够筛选极少部分同样热爱知识整理和分享的小伙伴,所以我继续安排了一些学徒作业题:
如果看到这些习题的你也感兴趣加入我们的在线学徒列表,欢迎随机挑选一个作业尝试完成后,邮件汇报给我你探索的过程!我的邮箱 jmzeng1314@163.com
这个甲基化数据分析不免费了
因为分析起来的确很耗费计算机资源