基因组调控中心(CNAG-CRG)国家基因中心的霍尔格海恩领导的新研究提出了一个复杂的计算框架,可以分析单细胞的基因表达水平,并可以扩展到处理数百万个单细胞。发表在科学期刊《基因组研究》 (Genome Research)上的最新研究成果首次展示了一种可以分析如此大规模单细胞RNAseq数据集的工具。这大大拓展了单细胞基因组研究的范围。
人体内的所有细胞都有相同的基因组,但由于基因表达,每个细胞在组织或器官中可能会变得特异。全世界的科学家都在研究一种细胞与另一种细胞的区别。基因组研究目前面临的挑战之一是分析许多单个细胞,以发现和识别这些差异。利用单细胞RNA测序分析单细胞对于迎接这一挑战非常重要,它彻底改变了我们对组织、器官和生物体复杂性的认识。通过一次观察一个细胞的基因表达,科学家现在可以以前所未有的分辨率描述样本的异质性,而无需事先知道其组成。
因此,一个大规模的单细胞项目导致了对以前未知的细胞类型的鉴定,并绘制了生物的全面细胞图。在“人类细胞图谱”项目的框架内,研究人员旨在创建一个组成人体的所有细胞类型的图谱。然而,这种研究产生了大量的测序数据,分析大数据集是一个重大挑战。
一组CNAG-CRG科学家与来自庞贝法布拉大学(UPF)和锡伯大学的研究人员合作,开发了一个高效的计算框架,可以处理、分析和解释这样的大规模单细胞实验。该团队通过分析一项最大的单细胞研究展示了其策略的力量,该研究在发育中的小鼠大脑中有130万个单细胞。
CNAG-CRG研究小组负责人、这项研究的资深作者Holger Heyn说:“BigSCale在识别细胞类型特异性基因方面非常强大,这极大地有助于解释下游实验。”名为“BigSCale”的分析工具的新颖之处在于可以灵敏地确定单个细胞之间差异的数值模型。在画出细胞之间的差异后,可以将它们分成一组细胞来描述给定组织的细胞复杂性。由于几乎所有的组织都由不同的细胞类型和亚型组成,这种分析可以在没有初始假设的情况下指导无偏的深入表征。
此外,该工具旨在应对大型数据集的未来挑战。Heyn博士补充说:“获得单细胞谱的成本正在降低,我们正在研究增加细胞数量的研究。”在这方面,BigSCale工作流中的模块可以通过方向卷积策略分析数百万个单元。这里,来自相似细胞的单细胞转录组被合并到索引细胞中,这大大减少了要处理的数据量。
在新工具的帮助下,该团队分析了130万个细胞中最大的单细胞基因表达数据集之一,该数据集可从10x基因组公司公开获得。这项研究的第一作者乔瓦尼雅科诺评论说:“BigSCale使我们能够深入研究小鼠大脑的发育过程,甚至能够表征罕见类型的神经元细胞。”具体来说,大量的细胞使该团队能够扩大一个名为Cajal-Retzius细胞的小型瞬时细胞群,并描述与不同分化阶段、空间组织和细胞功能相关的主要子结构。Heyn博士解释说:“BigSCale框架几乎可以为任何物种提供强大的解决方案,甚至可以应用在RNA测序的背景之外。”我们补充说,“我们希望这个框架将有助于解释大规模的研究,
标签:
免责声明:本文由用户上传,如有侵权请联系删除!