导读 研究人员挖掘了一个数据库,其中包含几乎所有已知蛋白质的结构——使用Google DeepMind 革命性的 AlphaFold 神经网络预测了超过 2 亿...
研究人员挖掘了一个数据库,其中包含几乎所有已知蛋白质的结构——使用Google DeepMind 革命性的 AlphaFold 神经网络预测了超过 2 亿条条目。这项工作揭示了全新的形状、生命机器中令人惊讶的联系,以及几年前无法想象的其他见解。
首尔国立大学的计算生物学家 Martin Steinegger 表示,科学家们立即发现该资源很方便,但他们中的许多人只关注单个结构或相关结构家族,他对绘制整个数据库的关系感兴趣。“我认为看看我们的结构宇宙到底有多大会很有趣。”
为此,由 Steinegger 和瑞士苏黎世联邦理工学院计算生物学家 Pedro Beltrao 共同领导的团队开发了一种工具,可以根据形状的相似性快速比较数据库中的每个结构。这在 AlphaFold 数据库1中识别出了超过 200 万个形状相似的蛋白质“簇” 。
研究人员通常使用基因编码的蛋白质序列进行此类比较。但与它们的结构相比,蛋白质序列在进化过程中往往变化得更快,限制了寻找关系极远的蛋白质的能力。Steinegger 估计,通过比较蛋白质结构,他们识别出的相关蛋白质簇的数量是仅使用序列时的 10 倍。
研究人员才刚刚开始探索蛋白质宇宙中这些新发现的“星系”,但他们已经发现了一些令人惊讶的联系。例如,他们发现人类和其他复杂生物体用来检测病毒 DNA 并引发快速免疫攻击的一种蛋白质与来自单细胞细菌和古细菌的蛋白质处于一个簇中——这种联系以前并不为人所知,斯坦尼格说。
对于超过三分之一的蛋白质簇几乎一无所知。“我真的希望生物学家能够为这个黑暗带来一些曙光,”斯坦格说。
标签:
免责声明:本文由用户上传,如有侵权请联系删除!