24K数据挖掘发文套路

文章题目:

Identification of Potential Key Genes Associated With the Pathogenesis and Prognosis of Gastric Cancer Based on Integrated Bioinformatics Analysis

文章链接:

https://www.frontiersin.org/articles/10.3389/fgene.2018.00265/full

文章摘要:

背景和目的:尽管多模式管理取得了显着进展,但胃癌(GC)仍然是全球癌症死亡率的第三大原因,迫切需要确定新的诊断和预后生物标志物。该研究旨在确定与GC的发病机制和预后相关的潜在关键基因。

方法:通过多基因表达谱数据集的综合分析筛选GC与正常胃组织样本之间的差异表达基因。通过蛋白质 - 蛋白质相互作用网络和Cox比例风险模型分析,确定了与GC发病机制和预后相关的关键基因。

结果:我们鉴定了9个可能与GC发病机制密切相关的中枢基因(TOP2A,COL1A1,COL1A2,NDC80,COL3A1,CDKN3,CEP55,TPX2和TIMP1)。构建了由CST2,AADAC,SERPINE1,COL8A1,SMPD3,ASPN,ITGBL1,MAP7D2和PLEKHS1组成的预后基因标记,其在预测总存活率方面具有良好的性能。

结论:本研究结果为进一步研究诊断和预后生物标志物以促进GC的分子靶向治疗提供了一定的指导意义。

文章主要思路:

1、从GEO上下载数据

2、对下载芯片数据进行差异分析,筛选出差异基因

3、从TCGA上下载数据

4、对TCGA RNAseq数据进行差异分析,筛选差异基因

5、取GEO和TCGA交集的差异基因

6、对差异基因做GO,KEGG富集分析

7、PPI分析,构建子网络,筛选hub基因

8、对利用TCGA生存数据进行Cox回归

9、根据风险评分进行生存分析

(0)

相关推荐