24K数据挖掘发文套路
文章题目:
Identification of Potential Key Genes Associated With the Pathogenesis and Prognosis of Gastric Cancer Based on Integrated Bioinformatics Analysis
文章链接:
https://www.frontiersin.org/articles/10.3389/fgene.2018.00265/full
文章摘要:
背景和目的:尽管多模式管理取得了显着进展,但胃癌(GC)仍然是全球癌症死亡率的第三大原因,迫切需要确定新的诊断和预后生物标志物。该研究旨在确定与GC的发病机制和预后相关的潜在关键基因。
方法:通过多基因表达谱数据集的综合分析筛选GC与正常胃组织样本之间的差异表达基因。通过蛋白质 - 蛋白质相互作用网络和Cox比例风险模型分析,确定了与GC发病机制和预后相关的关键基因。
结果:我们鉴定了9个可能与GC发病机制密切相关的中枢基因(TOP2A,COL1A1,COL1A2,NDC80,COL3A1,CDKN3,CEP55,TPX2和TIMP1)。构建了由CST2,AADAC,SERPINE1,COL8A1,SMPD3,ASPN,ITGBL1,MAP7D2和PLEKHS1组成的预后基因标记,其在预测总存活率方面具有良好的性能。
结论:本研究结果为进一步研究诊断和预后生物标志物以促进GC的分子靶向治疗提供了一定的指导意义。
文章主要思路:
1、从GEO上下载数据
2、对下载芯片数据进行差异分析,筛选出差异基因

3、从TCGA上下载数据
4、对TCGA RNAseq数据进行差异分析,筛选差异基因

5、取GEO和TCGA交集的差异基因

6、对差异基因做GO,KEGG富集分析

7、PPI分析,构建子网络,筛选hub基因

8、对利用TCGA生存数据进行Cox回归

9、根据风险评分进行生存分析

赞 (0)
