随着澳大利亚和北美研究人员开发的新开源数据库的发布,共享揭示基因组变异在健康和疾病中的功能的数据集变得更加容易。
MaveDB数据库是存储来自实验数据的数据的存储库(称为突变效应的多重测量)。该系统可以系统地测量数千个单序列变异对基因功能的影响。这些实验可以提供有价值的信息,说明该基因产生的蛋白质是如何发挥作用的,该基因的变体是如何引起疾病的,以及如何设计一种比原始蛋白质更有效的天然蛋白质的合成形式。
MaveDB是第一个可以公开访问这些数据的数据库。它的发展由澳大利亚沃尔特和伊莱扎霍尔学院的艾伦鲁宾博士、美国华盛顿大学副教授道格拉斯福勒和加拿大多伦多大学的弗雷德里克罗斯教授领导。MaveDB在今天的《基因组生物学》杂志中有描述。
乍一看
新开发的数据库MaveDB增强了复杂功能基因组数据集的共享。
MaveDB是一个易于使用的存储库,用于存储来自多次突变效应分析(MAVE)的数据,用于解释穷尽测量不同基因突变效应的实验结果。
MaveDB增强了研究人员获取和解释复杂功能基因组数据的能力,从而加快了对基因的基础生物学、基因在疾病中的作用以及如何工程蛋白质以创造更有效的变体的研究。
加强基因组学研究
鲁宾博士说,MAVE彻底改变了研究人员理解基因功能及其在疾病中的作用的能力。
他说:“过去,研究人员必须关注基因的一些变化,才能了解它们的功能。”他说:“通过彻底扫描可能有数百或数千个碱基的基因变异来生成数据太复杂了。
“微型飞行器的发展为研究人员提供了一种方法,通过实验来测量基因的每个个体遗传变化及其功能后果。这些检测方法可以处理成千上万的基因变异,这样研究人员就可以探索相关的变化,并将其放在背景中”。
迄今为止,来自实验的MAVE数据是孤立存在的。当研究论文发表或应要求提供给其他研究人员时,个别研究的数据将被上传到期刊网站。
鲁宾博士说:“这使得研究人员很难获得其他群体的数据,甚至很难知道已经进行了一项特定的MAVE实验。因此,这可能会阻碍合作和基因组学研究的进展。”
“MaveDB采用了一种适用于多个研究领域的灵活格式,这使得科学家可以更容易地在一个地方共享他们的数据集,并使其他科学家能够轻松访问这些数据以增强他们的研究。我们还确保MaveDB可以“与其他数据库对话”以增加协作。对于不断增长的MAVE研究领域来说,通过确保数据的可用性,数据库是迈向开放科学和可重复性的重要一步。"
从MAVE获得的数据有许多应用,包括了解基因或蛋白质的功能,测量遗传变异在疾病中的参与程度,或了解如何使合成蛋白质(如生物技术中使用的蛋白质)更有效。
视觉数据
除了建立MaveDB,该团队还开发了一个名为MaveVis的数据可视化软件,使研究人员更容易理解和解释MAVED实验的结果。
Rubin博士说:“Mavevis提供了MaveVis数据的即时和一致显示,包括有价值的注释(如蛋白质结构信息),这将加速协作研究。”
“我们设想,随着MaveDB在生物信息学领域的广泛应用,还会增加其他应用,这将为可视化和解释复杂的基因组学数据提供新的方法——从而带来新的发现,以增强生物医学研究。这可能会支持新药的开发,或者理解患者的基因组变异是如何导致疾病的。”
标签:
免责声明:本文由用户上传,如有侵权请联系删除!