印第安纳州西拉斐特——使用机器学习进行药物开发的挑战之一是为计算机创建一个从一组数据点中提取所需信息的过程。药物科学家必须提取生物数据并训练软件,以了解典型的人体将如何与药物组合相互作用。
普渡大学的药物发现研究人员创建了一个新的数据挖掘框架,用于训练机器学习模型。这个名为Lemon的框架可以帮助药物研究人员更好地挖掘蛋白质数据库(PDB),这是一个拥有超过14万种生物分子结构的综合资源,每周都有新的结构发布。这项工作发表在10月15日的《生物信息学》杂志上。
普渡大学科学学院分析和物理化学助理教授Gaurav Chopra说:“PDB是药物发现领域的重要工具。”问题是,整理所有积累的数据可能需要很多时间。机器学习可以有所帮助,但你仍然需要一个强大的框架,计算机可以从中快速分析数据,以帮助创建一个安全有效的框架。。"
柠檬软件平台是一个带有Python绑定的快速C 11库,几分钟就能开采出PDB。在PDB加载所有传统mmCIF文件大约需要290分钟,但Lemon在8核电脑上应用简单的工作流程大约需要6分钟。Lemon允许用户编写自定义函数,将它们包含在其软件包中,并以标准方式开发自定义函数,从而为整个科学界生成独特的基准测试数据集。
与Chopra合作开发化学博士平台的Jonathan Jonathan Fine表示:“沉积在PDB的实验结构为结构和计算生物学的科学和教育带来了很多进步,有助于推动药物开发等领域的发展。”“我们创建了Lemon作为一站式商店,可以快速挖掘整个数据库,提取对药物开发至关重要的有用生物信息。”
Lemon之所以得名,是因为它最初旨在为药物设计软件创建基准测试集,并识别lemon与在PDB无法很好建模的生物分子之间的相互作用。
标签:
免责声明:本文由用户上传,如有侵权请联系删除!