你身体中大约 40 万亿个细胞中的大多数都拥有几乎相同的基因组拷贝——从你父母那里继承的 DNA,包含从将食物转化为能量到抵抗感染的所有指令。健康细胞通过基因组中的有害突变变成癌细胞。例如,如果一个细胞的基因组被紫外线损坏,它可能会导致突变,导致细胞无法控制地生长并形成肿瘤。
识别导致健康细胞变成恶性的基因变化可以帮助医生选择专门针对肿瘤的疗法。例如,大约 25%的乳腺癌是HER2 阳性的,这意味着这类肿瘤中的细胞会发生突变,导致它们产生更多的称为 HER2 的蛋白质来帮助它们生长。专门针对HER2 的治疗显着提高了此类乳腺癌的存活率。
科学家们现在可以很容易地读取细胞 DNA 来识别突变。挑战在于人类基因组非常庞大,而突变是进化的正常部分。人类基因组的长度足以填满一本 120 万页的书,任何两个人大约可以拥有300 万个遗传差异。在肿瘤中找到一个致癌突变就像在一堆针中找到一根针。
我是一名计算机科学家,他探索大型复杂的遗传数据集,以回答有关生物学和疾病的基本问题。我和我的研究团队最近发表了一项研究,该研究使用来自数千名健康人的 DNA,利用自然选择原理帮助识别致病突变。
利用大数据发现癌变
在确定患者的癌症突变类型时,金标准是比较患者的两个样本:一个来自肿瘤,另一个来自健康组织(通常是血液)。由于两个样本都来自同一个人,他们的大部分 DNA 是相同的;只关注彼此不同的遗传区域会大大缩小可能致癌突变的位置。
虽然基因突变是日常生活的一部分,但有些可能会导致癌症。
问题是健康组织并不总是从患者身上收集,原因从临床成本到狭窄的研究方案。
解决这个问题的一种方法是查看大量的公共 DNA 数据库。由于癌症驱动突变不利于生存,自然选择往往会随着时间的推移在连续几代中消除它们。在肿瘤的所有突变中,在特定人群中发生频率较低的突变比许多人共有的变化更可能有害。经过计算这些数据库中突变发生的频率,研究人员可以区分常见且可能是良性的基因变化和罕见且可能癌变的基因变化。
鉴于这种方法的威力,最近出现了大量收集和共享数百到数千人的 DNA 序列的项目。这些项目包括1000 基因组计划、西蒙斯基因组多样性计划、GnomAD和All of Us。未来可能还会有更多。
标签:
免责声明:本文由用户上传,如有侵权请联系删除!