冷泉港实验室的定量生物学家大卫麦坎德利斯(David McCandlish)和周娟楠(Juannan Zhou)开发了一种预测算法,这种算法使科学家能够看到特定的基因突变如何结合起来改变一个物种进化中的关键蛋白质。
《自然通讯》中描述的算法被称为“最小上插值法”,可以直观地显示蛋白质是如何进化成高效或根本无效的。他们比较了成千上万种蛋白质的功能,发现了这种突变是如何导致蛋白质从一种功能形式进化到另一种功能形式的。
“癫痫症”描述的是基因突变之间的任何相互作用,其中一个基因的功能依赖于另一个基因的存在。在许多情况下,科学家认为,当现实与他们的预测模型不一致时,基因之间的这些相互作用将发挥作用。考虑到这一点,麦坎德利斯基于每个突变都很重要的假设,创建了这个新算法。术语“内插”描述了预测物种中可能实现最佳蛋白质功能的突变的进化路径的行为。
研究人员通过测试构成链球菌GB1蛋白的基因中特定突变的影响来创建该算法。他们选择GB1蛋白是因为其结构复杂,会产生大量可能的突变,可以通过多种可能的方式结合。
“由于这种复杂性,这个数据集的可视化变得非常重要,”麦坎德利斯说。“我们想把数字变成图片,这样我们就能更好地理解(数据)告诉我们的东西。”
可视化就像拓扑图。图上两点之间的距离代表了突变发展到蛋白质活性水平需要多长时间。
GB1蛋白具有来自自然界的中等水平的蛋白质活性,但它可能通过几个不同位置的一系列突变进化为更高水平的蛋白质活性。
麦坎德利斯将蛋白质的进化路径比作徒步旅行,在徒步旅行中,蛋白质是一种试图最有效地到达最高或最好的山峰的徒步旅行者。基因以同样的方式进化:寻求通过突变来最小化抗性和提高效率的方法。
为了到达山脉的下一个最高峰,徒步旅行者更有可能沿着山脊线旅行,而不是一路走回山谷。沿着山脊线,有效地避免了另一个可能困难的上升过程。在可视化中,山谷是蓝色区域,在那里突变的组合导致最低水平的蛋白质活性。
该算法显示了每个可能突变序列的最佳程度,以及遗传序列突变成许多其他可能序列所需的时间。就新冠而言,这一工具的预测能力可能特别有价值。研究人员需要知道病毒的发展,以便在病毒达到最危险的形式之前知道在哪里和什么时候拦截它。
McCandlish解释说,该算法还可以帮助“理解病毒在进化过程中可能采取的遗传途径,以逃避免疫系统或获得耐药性。如果我们能理解可能的方法,那么也许我们可以设计一种可以阻止进化的治疗方法。或者免疫逃逸。”
这种预测遗传算法还有其他潜在的应用,包括药物开发和农业。
“你知道,在遗传学开始的时候.所有关于这些基因空间的有趣猜测,如果你真的能看到它们,会是什么样子,”mccandless补充道。“现在我们真的做到了!这真的很酷。”
标签:
免责声明:本文由用户上传,如有侵权请联系删除!