加州大学圣地亚哥分校的研究人员创建了一种工具,可以使用可解释的人工智能 (AI) 系统和其他机器学习方法分析糖组学数据集。在最近发表在Nature Communications 上的一篇论文中,该团队证明糖组学数据需要格外小心才能正确用于统计分析或机器学习。他们还提供了一种新的预处理解决方案来准备糖组学数据,以大大提高其在机器学习和人工智能中的使用能力。他们将该方法命名为 GlyCompare。它从系统层面的角度考虑了样品内和样品间聚糖的共享生物合成途径。
为了介绍 GlyCompare,该团队展示了他们通过揭示多种情况下多糖之间的隐藏关系(包括胃癌组织)来增强糖组学数据集比较的能力。考虑到聚糖变化对癌症的重要性及其在早期诊断中的效用,癌症是一个有用的例子。
“我们将 GlyCompare 应用于癌症组织,并表明虽然使用标准统计方法无法找到癌症特异性聚糖,但使用我们的方法处理时会出现新的生物标志物,”加州大学圣地亚哥分校生物工程和儿科教授 Nathan Lewis 说,他是相应的作者在纸上。Lewis 共同指导CHO 系统生物学中心,并使用糖工程化 CHO 细胞系生产研究中使用的多种蛋白质。
在另一项分析中,该团队表明该方法显着提高了统计能力,因此需要一半的样本才能获得等效的能力来检测生物标志物。在论文中,研究人员概述了 GlyCompare 背后的方法将如何变革性地将糖组学带入临床。事实上,Lewis 是一家新初创公司创始团队的一员,该公司正在授权相关知识产权,将这项技术商业化,用于高价值应用,包括癌症诊断。
GlyCompare 方法的关键之一是它着眼于合成构成聚糖的亚基所需的生物学步骤,而不是仅仅着眼于整个聚糖本身,大大提高了糖组学数据统计分析的准确性。研究人员认为,这种方法将能够在包括早期癌症在内的许多应用中检测糖基化的更细微变化。此外,GlyCompare 可以对所观察到的聚糖变化背后的机制产生新的见解。
标签:
免责声明:本文由用户上传,如有侵权请联系删除!