因人而异的 DNA 片段(称为变体)是使我们与众不同的主要部分,但它们也可能使我们面临更大的疾病风险。尽管我们目前可以拼出人类基因组中数以百万计的 80% 到 90% 的基因,但剩余的变异可能为治疗一系列疾病提供了线索。今天,尚未解码的变体列表已大大缩小。
由美国国家标准与技术研究院 (NIST)、贝勒医学院和 DNAnexus 的研究人员领导的一个团队对 273 个具有医学重要性的基因中的 20,000 多个变体进行了表征。在《自然生物技术》杂志上发表的一项研究中,研究人员应用了尖端和长期存在的 DNA 测序方法,以高度确定的方式破译了变异的遗传密码。利用他们的结果,他们制定了有助于实验室和诊所更准确地对基因进行测序的基准,这对于更好地了解一系列疾病并最终开发治疗方法至关重要。
“其中一些以前很难获得的基因被怀疑与疾病有某种联系。其他的具有非常明显的临床重要性,”该研究的合著者 NIST 生物医学工程师 Justin Zook 说。“例如,SMN1 是一种我们表征的基因,它与脊髓性肌萎缩症直接相关,脊髓性肌萎缩症是一种罕见但严重的疾病。”
新的基准是瓶中基因组 (GIAB) 联盟最新制定的,该联盟由 NIST 主持,旨在改进 DNA 测序技术并使它们在临床应用中实用。
这些基准是高度准确的 DNA 序列,诊所和研究实验室在测试他们自己的测序方法时可以将其用作一种答案。通过对用于开发基准的相同基因组进行测序,然后将其结果与基准本身进行比较,他们可以了解他们检测某些变体的能力。
多年来,为基因组的某些区域制定基准比其他区域困难得多。有几个原因,其中许多与人们用来测序 DNA 的一般方法有关。
DNA测序技术不是一次性对整个基因组进行测序,而是首先读取一小部分DNA的序列,然后尝试将它们正确地组合在一起,类似于拼图。参考基因组是人类基因组计划完成的第一个参考基因组,几乎是完整的基因组,由几个人的 DNA 拼接而成,可作为拼图放置位置的指南。
由于我们作为一个物种共享近99.9% 的基因构成,因此任何人类基因组都将具有与参考基因组大致相同的代码。这意味着将基因组放在一起是根据它们与参考匹配的位置来布置片段的问题。大多数变体都使用此过程。某些类型将扳手放入其中。
特别是,一种称为结构变异的类型可以在基因组和参考基因组之间产生很大的差异。它们的范围从 50 到数千个字母或碱基,并采取多种形式,包括插入、删除或重新排列的代码。Zook 说,基因组与参考越不同,使用参考作为指导就越困难。
结构变异可能导致实验室无意中放错 DNA 块,并且在临床环境中,这种错误可能导致与疾病相关的变异逃避检测或无害变异产生警报。除了人力成本之外,由于这些错误测量而不必要或为时已晚的治疗可能会确定未来患者需要更昂贵或侵入性的治疗,从而大幅推高医疗保健成本。
然而,测序技术的最新进展已经清除了其中一些障碍。在这项新研究中,GIAB 联盟应用最新技术来解码人类基因组中一些与已知或疑似疾病相关的最难以捉摸的区域。
这项工作的一个关键参与者是高保真或 HiFi 测序,它可以对更长的 DNA 片段进行测序。Zook 说,常见的 DNA 测序方法可以读取大约一百个碱基,但通过 HiFi 测序,您一次可以准确读取数万个碱基。
标签:
免责声明:本文由用户上传,如有侵权请联系删除!