导读 第一个真正完整的人类基因组序列,从头到尾覆盖每条染色体,没有间隙和前所未有的准确性,现在可以通过 UCSC 基因组浏览器访问,并在 3
第一个真正完整的人类基因组序列,从头到尾覆盖每条染色体,没有间隙和前所未有的准确性,现在可以通过 UCSC 基因组浏览器访问,并在 3 月 31 日发表在《科学》杂志上的六篇论文中进行了描述。
自从2000 年在加州大学圣克鲁兹分校组装了人类基因组序列的第一个工作草案以来,基因组学研究已经导致我们对人类生物学和疾病的理解取得了巨大进步。然而,由于 DNA 测序技术的限制,占人类基因组约 8% 的关键区域在 20 多年来一直对科学家隐藏。
加州大学圣克鲁兹分校生物分子工程助理教授 Karen Miga 和国家人类基因组研究所 (NHGRI) 的 Adam Phillippy 组织了一个国际科学家团队——端粒到端粒 (T2T) 联盟——来填补缺失的部分.他们的努力现在得到了回报。
新的参考基因组称为 T2T-CHM13,增加了近 2 亿个碱基对的新 DNA 序列,包括 99 个可能编码蛋白质的基因和近 2000 个需要进一步研究的候选基因。它还纠正了当前参考序列中的数千个结构错误。
现在由新序列填补的空白包括五个人类染色体的整个短臂,并覆盖了基因组中一些最复杂的区域。这些包括在重要染色体结构中和周围发现的高度重复的 DNA 序列,例如染色体末端的端粒和在细胞分裂过程中协调复制染色体分离的着丝粒。新序列还揭示了以前未检测到的片段重复,即在基因组中重复的长段 DNA,并且已知在进化和疾病中发挥重要作用。
“人类基因组的这些部分我们已经 20 多年无法研究,这对于我们了解基因组如何工作、遗传疾病以及人类多样性和进化非常重要,”米加说。
许多新发现的区域在基因组中具有重要功能,即使它们不包括活性基因。
标签:
免责声明:本文由用户上传,如有侵权请联系删除!