什么?你还在用GEO2R进行差异表达分析

GEO虽是一个宝库,但是使用GEO进行数据分析可不是一件简单的事!

首先,GEO的数据检索非常不方便,例如,我想获取有预后信息的乳腺癌数据,显然使用GEO官方检索起来很难。

其次,GEO大部分数据都基因芯片数据,不能直接用于转录组分析。需要把芯片的表达转换为基因的表达,这就要求用户有一定的编程能力。

再次,即使你有一些编程能力,你还需要熟悉各种分析方法。对于非生信专业来说,这显然非常头大。

GEO官方也意识到了这些问题,提供了GEO2R功能,可是这对于广大用户来说,还是远远不够。作为一个工具人,于是就有了easyGEO(https://easygeo.cn),正如其名,就是为了使用GEO更容易一些。下面就以获取乳腺癌差异基因为例说明easyGEO的用法。

一、检索数据

打开easyGEO地址:https://easygeo.cn。

点击“查看更多”按钮,跳转到GEO数据列表页面。

  1. 疾病选择:“breast cancer”。
  2. 选中“生存数据”复选框。

这样就可以看到所有有预后信息的乳腺癌数据了。由于我们需要对正常样本乳腺癌样本进行差异表达分析,还需要有正常样本,这里选择数据GSE52568(https://easygeo.cn/#/series/GSE42568)进行差异表达分析。

二、数据预处理

在数据详情页面,点击“数据预处理”按钮即可进入。

在预处理页面只需要关注一个参数,那就是基因名称所在列easyGEO会根据该列将探针转换为基因。哪一列是基因名称所在列可以在平台的注释信息(点击“平台信息”按钮),本例中为Gene Symbol

点击开始预处理按钮即可进行数据预处理。

三、差异表达分析

待预处理完成,在预处理任务的右侧即可进入差异分析流程。

使用在线工具进行分析的时候,往往会碰到一个很棘手的问题,虽然工具提供的功能很好,但是往往需要用户把数据下载下来进行处理,得到特定的格式之后再把结果上传,然后再使用在线工具进行分析。一个常见的场景就是分组。

例如:

  1. 需要根据临床信息表中的年龄数据、肿瘤大小等连续数据分为高低两组。
  2. 临床信息表中的分组数据的合并,例如癌症IIa、IIb两个分期需要合并为同一个分期。

为了解决上述问题,easyGEO内置了一个分组工具。关于分组工具的使用方法见如何使用easyGEO分组工具(https://easygeo.cn/#/faqs/using-easyGEO-grouping-tool)。本例中使用tissue列快速新建分组。

这个时候,如果不需要调整参数,直接点击生成报告就可以了。查看示例报告(https://apts.gaptools.cn/media/geo/1414486662113001472/easyGEO-de-GSE42568-61560.pdf)。

灵魂工具人

大家好,我是灵魂工具人,我会分享一些由我做的生物信息工具以及一些我在工作过程中碰到的问题,希望大家喜欢。
14篇原创内容
公众号
(0)

相关推荐

  • 如何合并多套GEO数据集?

    首先,给大家看一张图,如下: 有很多人会问,这样图是怎样做的?下面,我们来告诉你 第一步,下载GDS3592和GDS1381数据集 第二步,分别对两个数据集做差异表达分析 第三步,将保存好的差异表达文 ...

  • GEO2R差异表达分析软件

        前两天我们对GEO数据库来了一个大致的介绍GEO数据集详细介绍GEO数据库介绍 (一).我们对于目标数据集,我们做的第一个事情就是差异分析,来寻找有差异的结果.所有的表达芯片做的差异表达分析都 ...

  • 比GEO2R更好用的GEO数据分析工具

    之前在介绍GEO数据库数据分析的时候,我们介绍过GEO2R这个在线的分析GEO芯片数据的工具.但是对于GEO里面的一些二代测序的数据,就没办法进行分析了.最近新发布了一个在线的数据库eVITTA,则可 ...

  • GEO在线分析工具

    GEO2R是GEO在线分析工具,基于此工具可以对部分GEO样品数据进行基因差异表达分析.该工具主要针对芯片数据,借助R 及Limma包完成分析过程,用户只需要在网业上进行简单的点击等手动操作即可获得分 ...

  • 4个数据集发到2区期刊?我15分钟零代码就能搞定!(附详细操作教程)

    解螺旋公众号·陪伴你科研的第2526天 零代码复现二区期刊 本次给大家零代码复现一篇2021年发表于Gland Surgery的中科院二区期刊,影响因子2.19分. 文章题目 Identificati ...

  • 东财转3为什么卖不掉?还能拿吗?深度分析并谈下周策略

    4月23日,万众瞩目的东财转3上市,开盘价130元,收盘价130元,最低价也是130元,很多人以130元委托卖出,却一直到收盘也没有成交,这是为什么呢?东财转3下周一走势会怎样?东财转3还能拿吗?很多 ...

  • 差异表达分析之FDR

    差异表达分析之FDR 随着测序成本的不断降低,转录组测序分析已逐渐成为一种很常用的分析手段.但对于转录组分析当中的一些概念,很多人还不是很清楚.今天,小编就来谈谈在转录组分析中,经常会遇到的一个概念F ...

  • 为什么人口持续流出的四五线城市,房价还一直在上涨呢?分析一下

    当前确实是存在着这么一种现象,就是一些人口持续性流出的四五线城市,房价不但不掉,还呈现持续上涨的态势,这是什么原因造成的呢?我这里给大家分析一下,仅供大家交流探讨. 地方政策性推动,是其房价上涨的主要 ...

  • 韩国美妆店出现倒闭潮,我国的美妆店还能撑多久?我们分析一下

    据媒体报道,韩国首尔市有一个知名的梨花女子大学商圈,在这个商圈里,开设有许多家主打青春活力的美妆专卖店,每到一年换季的时候,这些店铺便会推出当季新品供青年学生群体前来选购.然而,就在最近,这个商圈里大 ...

  • 你家抢过得菜、双黄连还好吗?|浅析供需分析与牛鞭效应

    2020年,这一年注定会让中国人记住. 农历春节前夕,神州大地一片祥和,所有中国人经过一年的努力期待合家团聚的时候,一场从武汉爆发的新型冠状病毒肺很快铺天盖地席卷全国,甚至海外.国家随即采取措施,减少 ...

  • Conquer-对单细胞数据差异表达分析的重新审视

    随着单细胞测序技术的流行,我们对复杂疾病和性状的理解从patient,tissue的表达谱(bulk RNA-seq)到单个细胞的表达谱(single cell RNA-seq).究其原因,在于bul ...

  • DESeq2差异表达分析

    在前文scRNA-seq marker identification(二),我们我们提到了差异分析,下面我们来详细了解下 学习目标 了解如何准备用于pseudobulk差异表达分析的单细胞RNA-se ...

  • DESeq2差异表达分析(二)

    接上文DESeq2差异表达分析 质量控制--样品水平 DESeq2工作流程的下一步是QC,它包括样本级和基因级的步骤,对计数数据执行QC检查,以帮助我们确保样本/重复 看起来很好. RNA-SEQ分析 ...

  • 插件 | 点点点,基因差异表达分析~几分钟就掌握了

    于是,TBtools - RNAseq 全家桶到位! 写在前面 很久很久以前,TBtools 解决了 RNAseq 数据分析中几个常见问题: 基因功能注释,NR,SWISSPROT,GO注释等 基因集 ...