021年7 月 7 日——根据最近发表在美国国家科学院院刊上的一项研究结果,先进机器学习软件的使用已导致识别出数百个可能影响工作免疫系统的新基因。美利坚合众国。
正向遗传学是反向工作的过程,从表型(通常由随机种系诱变剂诱导)开始,到致病突变的发现结束。传统上,筛选中检测到的突变表型与特定突变之间的联系是通过自动减数分裂映射 (AMM) 实现的,其中统计概率暗示了因果关系。然而,这并不是因果关系的唯一指标。
许多其他因素会影响正确选择真正的致病突变,包括:
突变的性质(良性、破坏性、无效)
断奶前基因生存的必要性
测试的纯合子数量和表型效应的大小
相关屏幕的数据差异特征
由突变引起的不同表型的数量
共分离突变的存在与否
其他具有类似作用的等位基因的观察
在目前的研究中,由诺贝尔奖获得者、宿主防御遗传学中心 (CGHD) 主任 Bruce Beutler 博士领导的德克萨斯大学西南大学的一个研究小组设定了使用人工智能准确推断种系突变是特定表型的原因。
该团队开发了 Candidate Explorer (CE),这是一种机器学习算法,将遗传图谱数据的 67 个特征整合到一个单一的数字分数中,在数学上可转换为任何假定的突变表型关联的验证概率。软件考虑的输入特征包括表型数据(来自筛选)、突变数据、基因数据和减数分裂映射数据。
Beutler 解释说,这项工作是近十年前开始的一项研究计划的一部分,旨在识别可能影响小鼠免疫系统的每个突变。根据当前研究的结果,该程序已被用于筛选超过 55% 的小鼠基因,以了解对血液中免疫细胞流式细胞术测量的影响。
“CE 的目的是帮助研究人员预测与表型(性状或功能)相关的突变是否是真正的致病突变,”Beutler 说。“CE 已经帮助我们鉴定了数百个在免疫中具有新功能的基因。这将提高我们对免疫系统的理解,以便我们能够找到保持其强大的新方法,并了解它有时会出现问题的原因。”
该研究侧重于免疫细胞群的变化,特别是 B 细胞、T 细胞、树突状细胞 (DC)、巨噬细胞、中性粒细胞、NK 细胞和 NK1.1+T 细胞。通过对来自突变小鼠的外周血白细胞的流式细胞术分析来检测和测量所有细胞群和亚群。
Candidate Explorer 成功评估了大约 87,000 个突变/表型关联,这些关联是通过循环免疫细胞的流式细胞术筛选确定的。从这些关联中,该软件区分了代表 2,336 个突变的 1,279 个基因,这些基因被评为良好或优秀的表型因果候选者。
数据表明,影响血液中免疫细胞群的大多数基因执行细胞类型或表型特异性功能。68% 的基因只有 1、2 或 3 个良好或极好的表型关联,而只有 23% 的基因具有超过 20 个良好或极好的关联(许多被确定为众所周知的免疫调节基因),这证明了这一点。 )。
此外,已知或预测对生存能力至关重要的 449 个基因 (35%) 与至少一种流式细胞术表型相关,表明许多对发育重要的基因可能在成年白细胞中也具有功能。
有趣的是,科学家们发现,良好或优良基因关联的数量因受影响的细胞类型而异。通常,B 细胞和 T 细胞表型与大多数基因相关,而 DC 表型与极少数基因相关。
研究人员还确定了代表“新”免疫学重要基因的 386 个基因。对于这些基因中的许多基因,以前没有主要的免疫学或其他表型数据可用。
这些数据将有助于小鼠遗传学家识别数量性状基因座内的致病突变,而临床遗传学家可以使用 Candidate Explorer 帮助将致病变异与罕见的遗传性免疫疾病联系起来,即使在没有连锁信息的情况下。通过这种方式,该软件可能会促进和加速对全基因组关联研究发现的疾病相关基因座内的因果变异的识别。
“我们现在已经研究了大约 60% 的基因组,并确定了数千个基因——其中数百个是新基因——它们参与了小鼠的免疫,” Beutler 评论道。“其中绝大多数也有助于人类免疫力。”
小鼠和人类基因组在基因的大小和含量上非常相似。
“几乎所有的小鼠基因都有人类对应物,反之亦然,” Beutler 解释说。
标签:
免责声明:本文由用户上传,如有侵权请联系删除!