人体由细胞组成的事实是一个基本的,易于理解的概念。然而令人惊讶的是,科学家们仍在尝试确定组成我们的器官并有助于我们健康的各种细胞。
一种称为单细胞测序的相对较新的技术使研究人员能够根据特征(例如它们表达的基因)来识别和分类细胞类型。但是,这类研究会产生大量数据,其中包含数十万到数百万个细胞的数据集。
计算医学和生物信息学系的Joshua Welch博士开发了一种新算法。候选人Chao Gao及其团队使用在线学习,大大加快了这一过程,并为全世界的研究人员提供了一种使用标准便携式计算机上发现的内存量来分析大型数据集的方法。该发现在《自然生物技术》杂志上有描述。
韦尔奇说:“我们的技术使任何拥有计算机的人都可以对整个生物体进行分析。”“这确实是该领域正在朝着的方向发展。”
该团队使用来自国立卫生研究院脑计划的数据集证明了其原理性证明。该计划旨在通过绘制每个细胞的图谱来了解人脑,该计划的研究团队遍布全国,包括韦尔奇实验室在内。
Welch解释说,通常,对于像这样的项目,必须按到达的顺序使用先前的数据集对提交的每个单单元格数据集进行重新分析。他们的新方法允许将新数据集添加到现有数据集中,而无需重新处理旧数据集。它还使研究人员能够将数据集分解为所谓的迷你批处理,以减少处理数据集所需的内存量。
韦尔奇说:“这对于越来越多地生成数百万个细胞的集合至关重要。”“今年,有五到六篇论文具有两百万个或更多的单元,而仅用于存储原始数据所需的内存量大大超过了他们计算机上的任何人。”
韦尔奇将在线技术比作Facebook和Twitter之类的社交媒体平台进行的连续数据处理,后者必须处理用户连续生成的数据,并在人们的供稿中提供相关信息。“在这里,我们在世界各地的实验室进行着实验,并发布了他们的数据,而不是人们写推文。”
这一发现有可能极大提高其他雄心勃勃的项目的效率,例如《人体图谱》和《人体细胞图谱》。韦尔奇说:“了解人体细胞的正常功能是了解它们在疾病中如何出错的第一步。”
标签: 海量细胞
免责声明:本文由用户上传,如有侵权请联系删除!