一个国际研究小组生成了第一个真正完整的人类 Y 染色体序列,这是最终被完全测序的人类染色体。新序列填补了 Y 染色体长度 50% 以上的空白,揭示了对生育力有影响的重要基因组特征,例如精子产生的因素。这项研究由端粒到端粒 (T2T) 联盟领导,该联盟是由国立卫生研究院下属的国家人类基因组研究所 (NHGRI) 资助的一个研究小组,今天发表在《自然》杂志上。
Y 染色体和 X 染色体经常因其在性发育中的作用而被讨论。虽然这些染色体发挥着核心作用,但与人类性发育有关的因素遍布整个基因组,而且非常复杂,从而产生了男性、女性和双性个体中发现的一系列人类性别特征。这些类别并不等同于性别,性别是一个社会类别。此外,最近的研究表明,Y 染色体上的基因有助于人类生物学的其他方面,例如癌症风险和严重程度。
20 年前,当研究人员完成第一个人类基因组测序时,所有 24 条染色体的序列都留下了缺口。然而,与基因组序列其余部分散布的小缺口(T2T 联盟去年填补的缺口)不同,Y 染色体序列的一半以上仍然是个谜。
所有染色体都有一些重复区域,但 Y 染色体异常重复,使其序列特别难以完成。组装测序数据就像尝试阅读一本被切成条的长书。如果书中的所有行都是唯一的,则更容易确定行的顺序。但是,如果同一个句子重复数千或数百万次,则条带的原始顺序就不太清楚了。虽然所有人类染色体都含有重复序列,但 Y 染色体上约有 3000 万个字母是重复序列。就好像这本书的一半长度都重复了同样的几句话。
为了解决人类基因组中最重复的片段,T2T 联盟应用了新的 DNA 测序技术和序列组装方法,以及从为其他 23 条人类染色体生成第一个无间隙序列中获得的知识。
“最令人惊讶的是重复的组织方式,”NHGRI 的高级研究员兼该联盟的领导者 Adam Phillippy 博士说。“我们不知道缺失的序列到底是什么组成的。它可能非常混乱,但相反,近一半的染色体是由两个称为卫星 DNA 的特定重复序列的交替块组成的。它形成了美丽的、像被子一样的图案。”
完整的 Y 染色体序列还揭示了医学相关区域的重要特征。Y 染色体的一个这样的部分被称为无精子症因子区域,这是一段 DNA,包含几个已知与精子产生有关的基因。利用新完成的序列,研究人员研究了无精子因子区域中一组反向重复或“回文”的结构。
NHGRI 科学家、 《自然》杂志的第一作者 Arang Rhie 博士说:“这种结构非常重要,因为这些回文有时会产生 DNA 环。” “有时,这些环会意外被切断并在基因组中产生缺失。”
众所周知,无精子症因子区域的缺失会破坏精子的产生,因此这些回文可能会影响生育能力。有了完整的 Y 染色体序列,研究人员现在可以更精确地分析这些缺失及其对精子产生的影响。
其他具有潜在医学相关性的区域包含重复的基因。人类基因组中的大多数基因都有两个拷贝,每个拷贝都遗传自父母。然而,一些基因有许多沿着 DNA 片段重复的拷贝,有时被称为“基因阵列”。
研究人员重点关注了TSPY,这是另一种被认为与精子生成有关的基因。TSPY的拷贝被组织在人类基因组中第的基因阵列中。与其他重复区域一样,重复基因的分析具有挑战性,因此虽然已知TSPY存在许多重复拷贝,但该阵列的具体 DNA 序列和组织结构以前是未知的。当研究人员分析这个区域时,他们发现不同的个体含有 10 到 40 个TSPY拷贝。
“当你发现以前从未见过的变异时,我们总是希望这些基因组变异对于了解人类健康非常重要,”菲利普博士说。“医学相关的基因组变异可以帮助我们在未来设计更好的诊断方法。”
除了完整的 Y 染色体序列外,NHGRI 资助的人类基因组结构变异联盟还报告了 43 条不同人类 Y 染色体的序列,该序列也在今天发表在同一期《自然》杂志上。这些进展补充了 T2T 联盟于 2022 年发布的无间隙人类基因组序列,以及NHGRI 资助的人类泛基因组参考联盟于 2023 年 5 月发布的“泛基因组” 。 通过这些成就,科学家们可以获得丰富的新基因组学资源来解开人类生物学的谜团,并为基因组医学的未来铺平道路。
标签:
免责声明:本文由用户上传,如有侵权请联系删除!