导读 奥兰多,2021 年 9 月 8 日——根据一项新的研究,世界上最大的野生植物、动物和真菌原始基因组序列存储库缺少监测和保护地球生物多样
奥兰多,2021 年 9 月 8 日——根据一项新的研究,世界上最大的野生植物、动物和真菌原始基因组序列存储库缺少监测和保护地球生物多样性所需的关键数据。
缺失的数据包括收集有机体样本的时间和地点,这是监测种群遗传多样性所必需的。
该研究最近发表在《美国国家科学院院刊》上。
Michelle Gaither 是 UCF 生物学系的助理教授,也是这项新研究的合著者。
“大量资金被用于生成这些基因组数据,但由于缺乏元数据,大多数对生物多样性监测没有用处,”UCF生物学系助理教授、该研究的合著者米歇尔盖瑟说。“时空元数据缺失造成的投资损失总计数千万美元,而且这个数额只会增加。”
该存储库 - 国际核苷酸序列数据库合作的序列读取档案 (SRA) - 是原始基因组序列的领先集合,其中包含来自全球野生植物、动物和真菌物种的超过 600 TB 的数据。科学家们继续以指数速度将基因组数据存入 SRA。
“然而,如果没有时间和位置元数据,我们就无法监测遗传多样性的变化,”盖瑟说。
在这项研究中,研究人员对 SRA 中的公开数据进行了搜索。他们评估了 SRA 数据在监测生物多样性方面的潜在用途,发现大多数存档的基因组数据集缺乏遗传生物多样性监测所需的时间和空间元数据,只有 14% 的 SRA 数据集包含有关生物体采样时间和地点的信息。
研究人员随后对缺少纬度和经度坐标的野生种群的 800 多个数据集进行了劳动密集型搜索,以填补缺失的数据。他们的活动联系了为资料库做出贡献以收集数据的科学家。尽管做出了这些努力,该团队只能获得大约 33% 的 SRA 数据集的地理空间坐标和收集年份。
标签:
免责声明:本文由用户上传,如有侵权请联系删除!