清华大学Narure子刊:深度学习算法预测多层次肽-蛋白质相互作用

通讯作者:赵诞;曾坚阳

通讯单位:清华大学

肽-蛋白质相互作用涉及各种基本的细胞功能,它们的鉴定对于设计有效的肽疗法至关重要。然而,大多数现有的预测方法严重依赖于高分辨率结构数据。

基于此,清华大学曾坚阳教授和赵诞提出了一个深度学习框架(CAMP)用于多级肽-蛋白质相互作用的预测,包括二元肽-蛋白质相互作用预测和相应的肽结合残基识别。相关工作以“A deep-learning framework for multi-level peptide–protein interaction prediction”为题发表在Nature Communications上。

综合结果表明:CAMP可以成功捕获肽和蛋白质之间的二元相互作用,并识别参与相互作用的肽的结合残基。此外,CAMP在二元肽-蛋白质相互作用预测方面优于其他最先进的方法。CAMP可以作为肽-蛋白质相互作用预测和识别肽中重要结合残基的有用工具,从而促进肽药物发现过程。

CAMP的工作流程和架构:(a)数据管理和标签提取的工作流程。首先从RCSBPDB中提取了所有含有肽作为配体的PDB复合物,并从DrugBank中提取了所有具有相应目标的肽药物。使用PLIP28检测PDB的肽-蛋白质对之间是否存在非共价相互作用来识别相互作用对。研究人员为肽和蛋白质生成了基于序列的特征图谱,包括残基水平的结构和理化特性、肽和蛋白质的内在无序趋势以及蛋白质进化信息。从PepBDB下载了相应的肽结合残基标签。这种残基级标签和成对的二元相互作用被视为CAMP的多级监督信息。(b)CAMP的网络架构。给定输入对的肽特征谱和蛋白质谱,特征提取器的数值通道处理数值特征,即进化蛋白质PSSM和肽或蛋白质序列中每个残基的内在无序趋势。分类特征,即肽或蛋白质的原始氨基酸、二级结构、极性和亲水特性由三个分类通道处理。将这些通道的输出连接在一起,然后输入到CNN模块中,肽和蛋白质的氨基酸表示的输出也输入到自注意力模块中以了解各个残基的重要性(即,单个残基对最终预测的贡献)。将自我注意模块和CNN模块的输出连接在一起,以通过三个完全连接的层预测每个肽-蛋白质对的结合分数,使用CNN模块的输出预测肽序列中每个残基的结合分数的肽。

来源:https://doi.org/10.1038/s41467-021-25772-4

(0)

相关推荐