德克萨斯大学MD安德森癌症中心的研究人员已经开发出了首创的基于人工智能(AI)的工具,该工具可以从单细胞数据集中准确地识别出罕见的重要生物学重要细胞群,这些细胞通常包含基因或蛋白质表达来自数千个细胞的数据。该研究今天发表在《自然计算科学》上。
该计算工具称为SCMER(单细胞流形保留特征选择),可以帮助研究人员对复杂数据集的噪声进行分类,以研究否则可能无法识别的细胞。
高级作者,生物信息学与计算生物学副教授Ken Chen博士解释说,SCMER可能广泛应用于肿瘤学及其他领域,包括对最小残留疾病,耐药性和免疫细胞群的研究。
Chen说:“现代技术可以产生大量数据,但要确定哪些基因或蛋白质在那些情况下实际上很重要变得越来越困难。”“例如,小细胞群可能具有可能在耐药性中起作用的重要特征,但是这些特征可能不足以将它们与更常见的细胞区分开。在分析单细胞数据集以使其能够检测这些稀有细胞及其独特的分子特征。”
在癌症研究中开发有效研究小型或稀有细胞种群的方法,是对国家癌症研究所(NCI)在2020年提出的挑衅性问题之一的直接回应,该问题被指定为一个重要且尚未开发的研究领域。SCMER旨在解决此问题,并使研究人员能够从日益复杂的数据集中获得最大收益。
与基于数据集中包含的所有数据将细胞分类为簇的传统方法不同,SCMER采取无偏见的方式来检测定义唯一细胞组的最有意义的区别特征。这使研究人员不仅可以检测稀有细胞群,还可以生成一组紧凑的基因或蛋白质,可用于检测许多其他细胞。为了突出SCMER的实用性,研究团队将其应用到分析了多个已发布的单细胞数据集,发现它与当前可用的计算方法相比具有优势。
在对超过4,500个黑色素瘤细胞的重新分析中,SCMER能够仅使用75个基因的表达来区分存在的细胞类型。结果还指出了许多与肿瘤发展和耐药有关的基因,在原始研究中没有被认为是有意义的。
在包含近40,000个胃肠道免疫细胞的复杂数据集中,SCMER仅使用250个不同的特征来分离细胞。该分析确定了在原始研究中检测到的所有原始细胞类型,但在许多情况下,进一步定义了以前未鉴定的稀有细胞亚组。
最后,研究小组应用SCMER研究了药物治疗后各个时间点采集的1,400多种肺癌细胞。该工具仅使用80个基因,即可根据治疗反应准确区分细胞,并指出了治疗耐药性的新驱动力。
标签: AI
免责声明:本文由用户上传,如有侵权请联系删除!