人工智能分析可访问的数据,以查明改变细胞活动的基因修饰。
基因测序技术和计算能力的进步显着提高了生物信息数据的可用性和处理能力。这种融合为人工智能(AI)开发控制细胞行为的方法提供了理想的机会。
在一项新的研究中,西北大学的研究人员通过开发一种人工智能驱动的迁移学习方法从这种联系中收获了成果,该方法重新利用公开数据来预测可以改变细胞类型或使患病细胞恢复健康的基因扰动组合。
该研究最近发表在《美国国家科学院院刊》上。
自从20年前人类基因组计划完成以来,科学家们已经知道人类DNA包含2万多个基因。然而,这些基因如何共同协调我们体内数百种不同的细胞类型仍然是一个谜。
令人惊讶的是,研究人员基本上通过引导试错法证明,仅通过操纵少数基因就可以“重新编程”细胞类型。人类基因组计划还促进了测序技术的进步,不仅使读取遗传密码变得更加便宜,而且还使测量基因表达变得更加便宜,基因表达可以量化执行细胞功能的蛋白质的前体。负担能力的提高导致了大量公开可用的生物信息数据的积累,提高了合成这些数据以合理设计基因操作以引发所需细胞行为的可能性。
控制细胞行为以及跨细胞类型转变的能力可用于再生受损组织或将癌细胞转化回正常细胞。
在美国,中风、关节炎和多发性硬化症导致的组织损伤每年影响 290 万人,每年造成的损失高达 4 亿美元。与此同时,癌症每年导致全球约 1000 万人死亡,造成数万亿美元的经济损失。由于当前的护理标准不能再生组织和/或功效有限,因此迫切需要开发更有效且广泛适用的治疗方法,这反过来又需要识别可以从高通量数据推断的分子干预措施。
在这项新研究中,研究人员使用公开的基因表达数据训练他们的人工智能来了解基因表达如何引起细胞行为。该学习过程生成的预测模型被转移到特定的细胞重编程应用程序。在每个应用中,该方法都会找到最有可能诱导所需细胞类型转变的基因操作组合。
对全基因组动态的前所未有的探索
该论文的主要作者、西北大学网络动力学中心成员托马斯·怀托克 (Thomas Wytock) 表示:“我们的工作与之前合理设计操纵细胞行为的策略的方法相比,脱颖而出。” “这些方法主要分为两类:一类是根据基因的相互作用或共同属性将基因组织成网络;另一类是基因根据其相互作用或共同属性组织成网络;另一种方法是对健康细胞和患病细胞的基因表达进行比较,以找出差异最大的基因。”
标签:
免责声明:本文由用户上传,如有侵权请联系删除!