研究方法系列 | CIRPES进化学分析平台简介

了解生物体的进化历史是生物学的中心问题。直到最近,推断进化关系的能力仍受可用的DNA序列数据量的限制,但是新的DNA测序技术已在很大程度上消除了这一限制。结果,DNA序列数据对于各种生物都是很容易获得或获得的,从而创造了前所未有的机会来探索整个生命之树中广泛而深入的进化关系。在近期的进化学分析中,本地笔记本电脑或台式机不再适合用于分析当今可用的更大数据集,于是CIPRES平台应运而生,该平台集合了多个软件功能,旨在为研究人员透明地访问最快的社区代码以推断系统发生关系,并在可压缩计算资源上实现这些代码,节省了大量科研成本和时间。本文介绍了CIPRES的具体使用方法。相关文献地址https://ieeexplore.ieee.org/document/5676129

为了满足越来越高对工具和工具的需求用于推断进化关系的资源(系统进化研究的网络基础设施)项目创建的门户网站CIPREShttps://www.phylo.org/,完全免费。CIPRES Portal 允许用户运行MAFFT, MUSCLE等序列比对软件,同时还有GARLI,RAxML,PAUP ,MrBayes, Jmodeltest,BEAST等进化树构建软件,但数据的展示需要其他软件辅助,例如FigTree或Mesquite。

具体使用方法如下, 首先来到主页面,右侧绿色框中提示目前所有任务运行正常,如果有维护情况,会以红框进行提示。

在主页面进行邮箱登录之后,来到个人操作页面。

个人操作页面中,可以进行文件夹创建。

创建后,会得到一个含有DATA和TASK 的文件夹,在DATA中需要用户进行数据上传,具体数据格式根据任务需求进行选择。本文以最简单的Maximum Likelihood phylogeny 为例建树。(ML法中,以一个特定的替代模型分析既定的一组序列数据,使所获得的每一个拓扑结构的似然率均为最大,挑出其最大似然率的最大拓扑结构为最终树)。

首先,在这个页面里面要对任务进行命名,然后来到下面界面进行工具选择。在CIPRES中,大概有十种ML树建树工具,其中本文选择最快速的建树工具RAxML。

首先,为任务进行命名,选择对应数据。RAxML 使用phylips数据格式,不同数据格式转换建议用Snapgene等简单软件进行。

之后选择具体使用工具。

如果对于每个工具的具体使用不了解,可以点击蓝色i号进行查看。

工具选择完毕后,必须查看参数,即使使用Default也需要查看。

RAxML工具中,笔者采用基本default,只改变了Bootstrap值,从100改到了1000.

在保存之后,会提示你本任务的CPU hour,每个任务最多可以跑168小时。确定无误后就可以点击Save and run。在任务结束后,邮箱会有一个相应通知。

之后可以返回CIPRES,查看output进行下载。

下载之后的文件使用ITOL或Figtree进行可视化分析即可。

CIPRES门户拥有强大可扩展性和可持续性,数据不会被删除,可以随时返回查看。

CIPRES还有其他很多软件,希望大家可以充分利用这个平台, 来推进进化学分析结果。祝大家使用愉快。

END

(0)

相关推荐