二十年前,人类的全基因组序列被释放。它由国际政府和慈善机构资助,耗资数十亿美元。
快进到2008年,在对更好的基因组理解和测序成本急剧下降的需求的推动下,建立了Genome 10K科学家社区(G10K),以促进和确保对10,000种脊椎动物进行基因组分析。由G10K赞助的脊椎动物基因组计划在过去几年中对测序生物技术进行了重大改进,以在未来几年内为所有约70,000个活体脊椎动物扩大高质量参考基因组组件的生产。
今天,G10K赞助的脊椎动物基因组计划(VGP)宣布了他们的旗舰研究和相关出版物,重点关注基因组组装质量和基因组学领域的标准化。这项研究包括从第一阶段试点的五年开始,针对具有主干的所有类群(即哺乳动物,两栖动物,鸟类,爬行动物和鱼类)的物种,包括16种高质量,近乎无错误和近乎完整的脊椎动物参考基因组组装体VGP项目。
在《自然》杂志的特刊中,以及在其他科学期刊上同时发表的伴随论文中,VGP详述了基于这16个基因组装配的众多技术改进。在这项新研究中,VGP演示了使用最新的自动方法(将长距离和长距离染色体支架方法与新颖的算法相结合)来设置和实现高质量参考基因组质量指标的可行性基因组装难题。迄今为止,当前的VGP流程已导致提交了129个二倍体组装体,这些组装体代表了迄今为止该物种的最完整,最准确的版本,并且正在生成数千个基因组组装体,这不仅证明了质量标准化的可行性,而且还证明了其可行性。规模。
这项研究的一部分动物包括但不限于:
哺乳动物:淡矛鼻蝠,埃及果蝠;加拿大山猫;vaquita;鸭嘴兽;
鸟类:斑马雀科;卡卡波安娜的蜂鸟;
爬虫类:古德的荆棘龟;
鱼:曲折鳗鱼;爬高的鲈鱼钝嘴的螯鱼。
“当我们最初提出G10K构想时,我们召集了一小撮不同领域的动物学家以及以基因组为中心的计算机科学家,他们承诺将共同开发世界上成千上万的脊椎动物的基因组序列数据。” .D。,新星东南大学(NSU)Halmos艺术与科学学院的教授兼研究科学家。“我们想为下一代基因组科学家提供一份礼物。今天,如此众多生物物种的基因组赋能梦想实现了巨大的飞跃。”
O'Brien是基因组10K联盟的共同创始人,俄罗斯圣彼得堡国立大学Theodosius Dobzhansky基因组生物信息学中心的首席科学官,并且是美国国家科学院的成员。
G10K-VGP的方法将装配流水线与手动管理相结合,以修复装配错误,重大缺陷和其他错误,从而为迭代开发更好的算法提供了信息。例如,VGP帮助揭示了高水平的假基因重复,丢失或增加,这主要是由于算法无法正确分离母本和父本染色体。一种解决方案包括三重装仓方法,该方法使用来自亲本的DNA来分离后代中的父本和母本序列。对于无法获得父母数据的情况,VGP和合作者开发的另一种解决方案是一种称为FALCON-Phase的算法,该算法可降低在染色体规模上分阶段确定母本和父本DNA序列的计算复杂性。
标签: 基因组测
免责声明:本文由用户上传,如有侵权请联系删除!