超实用干货贴 | 转录组测序原始数据如何上传到NCBI数据库?
转录组测序(RNA-Seq)是当下生物医学科研领域的热点技术,在SCI论文中频频亮相。但是无论是以RNA-Seq为试验主体的论文,还是以RNA-Seq为分析辅助手段的论文,在发表之前总是绕不开一个问题:杂志要求转录组测序的原始数据必须上传至NCBI(National Center for Biotechnology Information,美国国家生物技术信息中心)。而转录组的原始数据动辄几十上百G,怎样才能快速、简洁的将数据上传到NCBI呢?今天的这篇文章将为大家介绍转录组测序原始数据上传到NCBI数据库的流程与技巧,希望可以为遇到困难的新手们提供一些帮助!
操作步骤
1 注册NCBI账号
首先进入NCBI网站主界面(https://www.ncbi.nlm.nih.gov/),最好使用IE、Firefox或Google浏览器。之后如下图所示,按要求填好信息完成注册。
图1
图2
2 填写SRA基本信息
因为我们要上传的是转录组原始数据,所以应该选择上传到SRA。
图3
图4
图5
图6
图7
图8
图9
3 创建BioSample
图10
图11
图12
注:Biosample表格填写完成后一定要保存成.tsv或.txt格式,再上传回NCBI!!
4 上传数据到SRA
这里就是上传步骤中最重要的地方——SRA metadata
图13
图14
注:SRA metadata表格填写完成后一定要保存成.txt格式,再上传回NCBI!!
接下来就是如何将数据传到NCBI上了,推荐选择Aspera命令行上传方式,这也是最快速、便捷,且无视网络情况的上传方法。在这里我们只介绍Aspera命令行上传方式。
图15
注:Aspera软件可以在网上直接免费下载到电脑,在Windows环境下安装即可。
图16
将Aspera密码文件、转录组原始数据文件放到一个文件夹中,之后打开电脑的DOS命令窗口:
图17
图18
图19
图20
图22
5 SRA数据进度查询
图23
图24
好了,到此我们的转录组原始数据已经成功的上传到NCBI数据库里了!如果大家能够认真实际操作一遍的话,就会发现上传数据真的很简单呢!
本文不涉及任何商业利益,仅用于科研分享!如有侵权请联系删除!
END