环境、生活方式选择、化学品暴露、食源性和空气传播病原体是导致疾病的外部因素。相反,内部遗传因素可能导致疾病的发作和进展,从神经退行性疾病到某些癌症。
由佐治亚州立大学的Ivan Ilo Ivanov领导的团队使用了200 petaflop的IBM AC922 Summit系统,这是世界上最智能和最强大的超级计算机,开发了转录启动前复合物(PIC)的综合模型,这是一种对基因表达至关重要的蛋白质复合物。这项工作的结果发表在《自然结构和分子生物学》上。
基因表达涉及到来自DNA的遗传信息的转化,通过称为转录和翻译的步骤,产生蛋白质等功能分子,这是所有生物的基本组成部分。由于基因突变会干扰基因表达并导致疾病,因此生物医学科学家对了解患者独特的基因组成或基因型与疾病或表型的外部表现之间的关系特别感兴趣。
更好地理解基因型和表型之间的复杂关系可以揭示突变是如何引起遗传疾病的,从而为开发更有效的治疗方法提供信息。研究人员还没有完全理解基因突变如何影响蛋白质的功能。
伊万诺夫说:“就像机器中的齿轮断裂一样,这种突然的变化破坏了有缺陷的蛋白质的功能,这个过程涉及到结构和动态的变化。"这些因素的融合对传统的结构生物学方法提出了挑战."
被命名为Pol I、Pol II和Pol III的酶——统称为RNA聚合酶——在整个复杂且高度调控的基因转录过程中发挥着重要作用。Pol II有助于介导蛋白质的合成,即遗传信息转化为蛋白质的过程。
启动时——转录的第一步——Pol II和许多一般转录因子(GTF)聚集在称为启动子的DNA区域,形成PIC。开启启动子依赖于转录因子II human (TFIIH),一种由多条蛋白质链组成的GTF,具有解开DNA双螺旋启动转录的能力。TFIIH还有助于DNA修复。
由于负责基因表达和修复的生化途径相互交织,了解这一过程背后的分子机制对促进生物医学应用非常重要。例如,TFIIH三个亚基突变的存在直接导致严重的遗传疾病,包括自身免疫性疾病和神经系统疾病。
以前对PIC进行表征的尝试受到不完整模型的限制。到目前为止,最完整的PIC模型,团队的新版本,为这些蛋白质结构提供了极好的见解,这些蛋白质可以转录基因和修复DNA。
为了开发他们的PIC模型,研究人员结合了CryoEM的数据——一种使用电子束在低温下研究冷冻蛋白质样品的结构生物学方法——和使用纳米分子的Summit的大规模分子动力学模拟动态(NAMD)代码。Summit位于美国能源部橡树岭国家实验室(ORNL)的能源部科学用户设施办公室——橡树岭领导计算设施(OLCF)。
伊万诺夫说:“新模型为我们提供了TFIIH结构的最完整视图,这有助于我们了解这些蛋白质的动力学,并允许我们绘制患者衍生突变的起源图,这可能会使未来的生化实验专注于了解TFIIH的结构机制。
模拟了PIC的层次结构,说明了PIC中有多少结构成分可以修饰DNA。通过将36种不同的患者来源的突变映射到PIC模型,该团队确定突变倾向于聚集在TFIIH的关键区域,包括称为XPD的亚单位,该亚单位阻止GTF正常工作并导致疾病。
伊万诺夫说:“计算绝对有助于从CryoEM数据中提供结构和疾病表型之间的关系,这是一个高层次的概念,很难用单纯基于传统生物化学和结构生物学的答案来解释。
通过这些研究结果,该团队通过揭示其独特的分子机制,获得了与癌症、衰老和发育缺陷相关的三种不同遗传疾病的详细见解。
伊万诺夫说:“如果你知道蛋白质的哪些区域会受到影响,那么你可以开发一种治疗遗传性疾病的方法,但如果你对潜在的机制没有基本的了解,所有的赌注都将被取消。
这一成果为未来的实验和计算奠定了基础,可以准确识别导致遗传性疾病的突变,解释TFIIH对转录和DNA修复的独特贡献,深入研究基因表达的机制。
虽然这项研究在其他高性能计算平台上已经可行,但访问Summit大大加快了团队的模拟速度。
伊万诺夫说:“竞选峰会加速了我们的研究。“我们可以在几天内完成计算,而不是花几个月的时间在另一个系统上运行,这为我们节省了大量的时间和精力。”
今年,该团队将在2019年通过创新和新颖的理论和实验计算影响(INCITE)计划来计算峰会。研究人员主要研究Pol II,但他们计划扩大项目,研究Pol I和Pol III的功能动力学,这可能会带来更多突破性的见解。
伊万诺夫说:“我们不仅期望描述转录机制,还希望阐明它们与遗传疾病的关系。
标签:
免责声明:本文由用户上传,如有侵权请联系删除!