由Stein Aerts(VIB-KU Leuven)领导的比利时计算生物学家团队开发了一种新的生物信息学方法,称为cisTopic。受文本挖掘方法的启发,cisTopic通过寻找共同的主题,帮助科学家深入理解我们体内细胞内和细胞内基因调控差异的机制。在新出版的《自然方法》中,Aerts和他的团队展示了这种方法的广泛应用,从大脑研究到癌症生物学。
我们的基因组是由一组调节分子控制的,这些调节分子“打开”我们DNA中的目标基因。这些调节分子与我们染色体中所谓的增强子和启动子区域结合。知道它们何时以及如何被激活可以教会我们很多关于我们身体细胞多样性的知识。
“我们体内的所有细胞基本上都含有相同的DNA,”教授解释道。斯坦艾尔茨是VIB和库鲁汶计算生物学实验室的负责人。"每种细胞类型的独特之处在于哪些基因在任何给定的时间都是活跃的."
单细胞技术的最新发展使像Aerts这样的科学家能够研究基因活性,并调节脱氧核糖核酸区域中成千上万个细胞的可及性。然而,这些信息还没有解决反向工程基因组调控代码的挑战。
集群单元
Aerts实验室的两位年轻研究人员CarmenBravoGonzlez-Blas和Liesbeth Minnoye开始解决这个问题。“我们可以从单个细胞获得的数据,关于其DNA中特定调控区的可及性,是非常罕见的。但是,我们希望根据这些可访问区域的相似性对单个细胞进行分组。”
为了解决这个问题,bravogonzalez-Blas从文本挖掘领域借用了一种叫做“主题建模”的计算技术。她解释说:“在文本挖掘中,计算机可以从大量文本中找到对每个主题都很重要的“主题”和术语。当应用于我们的基因控制问题时,计算机会发现对每个细胞都很重要的话题。输入我们的身体。它还使我们能够确定每个主题的监管领域。”
“我们在各种数据集上评估了我们的新方法,发现它可以准确地恢复预期的和新的细胞类型,”Minnoye补充说。"特别是在非常稀疏的数据上,我们的方法比以前开发的方法更强大."
了解有关复杂组织的更多信息。
研究人员将cisTopic应用于生物复杂的细胞群,如哺乳动物大脑中的细胞。CisTopic不仅可以让他们恢复大脑中的主要细胞类型,而且该团队还可以识别主要神经细胞类型的新亚组和调节剂。
Aerts补充说:“除了大脑,我们还利用cisTopic研究患者黑色素瘤细胞培养中基因可及性的动态变化。“当我们调节这些癌细胞中已知的重要调节因子之一时,我们可以第一次跟踪不同DNA区域随时间的可及性。这些方法最终将使我们能够更好地理解这些主要调节因素在癌症中的实际作用。细胞和它们控制的基因。”
这些不同的应用说明了团队研究球员的新方法的价值,以及协调我们细胞中基因调控的机制。根据像Aerts这样的计算生物学家的说法,这是实现健康和疾病中细胞状态的实时和个性化监控的重要一步。
标签:
免责声明:本文由用户上传,如有侵权请联系删除!