线粒体是我们细胞中的隔室——所谓的“细胞器”——为我们提供移动、思考和生活所需的化学能量供应。叶绿体是植物和藻类中捕获阳光并进行光合作用的细胞器。乍一看,它们可能看起来天壤之别。但是,由卑尔根大学领导的一个国际研究小组已经使用数据科学和计算生物学来证明,相同的“规则”塑造了这两种细胞器类型——以及更多——在整个生命历史中的演变。
这两种细胞器都曾经是独立的有机体,拥有自己的完整基因组。数十亿年前,这些生物被其他细胞——现代物种的祖先——捕获和。从那以后,这些细胞器失去了大部分基因组,只有少数基因保留在现代线粒体和叶绿体DNA中。这些剩余的基因对生命至关重要,在许多破坏性疾病中也很重要,但是在许多其他基因丢失的情况下,为什么它们仍留在细胞器DNA中,已经争论了几十年。
为了对这个问题有新的看法,科学家们采用了数据驱动的方法。他们收集了所有已在生命中测序的细胞器DNA的数据。然后,他们使用建模、生物化学和结构生物学将关于基因保留的各种不同假设表示为与每个基因相关的一组数字。他们使用来自数据科学和统计学的工具,询问哪些想法可以最好地解释他们汇编的数据中保留基因的模式——用看不见的数据测试结果以检查它们的能力。
“建模中出现了一些清晰的模式,”卑尔根博士后研究员、该论文的共同第一作者KostasGiannakis解释道。“许多这些基因编码较大细胞机器的亚基,它们像拼图一样组装。拼图中间部分的基因最有可能留在细胞器DNA中。”
研究小组认为,这是因为保持对此类中央亚基生产的局部控制有助于细胞器快速响应变化——所谓的“CoRR”模型的一个版本。他们还为其他现有的、有争议的和新的想法找到了支持。例如,如果一个基因产物是疏水性的并且难以从外部导入细胞器,那么数据表明它通常被保留在那里。本身使用结合力更强的化学基团编码的基因也更常被保留,这可能是因为它们在细胞器的恶劣环境中更加健壮。
“这些不同的假设在过去通常被认为是相互竞争的,”卑尔根大学教授兼团队负责人伊恩约翰斯顿说。“但实际上,没有一种机制可以解释所有的观察结果——它需要结合起来。这种公正的、数据驱动的方法的优势在于它可以证明许多想法部分正确,但并非完全正确,这或许可以解释长期争论关于这些话题。”
令他们惊讶的是,研究小组还发现,他们训练来描述线粒体基因的模型也预测了叶绿体基因的保留,反之亦然。他们还发现,塑造线粒体和叶绿体DNA的相同遗传特征似乎也在其他内共生体的进化中发挥作用,这些内共生体是最近被其他宿主捕获的生物,从藻类到昆虫。
“那是一个令人惊叹的时刻,”约翰斯顿说。“我们和其他人有这样的想法,即类似的压力可能适用于不同细胞器的进化。但是看到这种普遍的、定量的联系——来自一个细胞器的数据精确地预测了另一个细胞器的模式,以及在最近的内共生体中——真的很惊人。”
该研究发表在CellSystems上,该团队现在正在研究一个平行的问题——不同的生物体如何维持它们确实保留的细胞器基因。线粒体DNA的突变会导致毁灭性的遗传疾病;该团队正在使用建模、统计和实验来探索人类、植物等如何处理这些突变。
标签:
免责声明:本文由用户上传,如有侵权请联系删除!