由 ICREA 研究员 Patrick Aloy 博士领导的结构生物信息学和网络生物学实验室已经使用深度机器学习计算模型完成了 100 万个分子的生物活性信息。它还公开了一种工具来预测任何分子的生物活性,即使没有可用的实验数据。
这种新方法基于化学检查器,这是迄今为止最大的伪药物生物活性概况数据库,由同一实验室开发并于 2020 年发布。化学检查器从每个分子的 25 个生物活性空间收集信息。这些空间与分子的化学结构、与其相互作用的靶标或其在临床或细胞水平上引起的变化有关。然而,对于大多数分子来说,这种关于作用机制的高度详细的信息是不完整的,这意味着对于特定的分子,可能有关于一两个生物活性空间的信息,但不是所有 25 个空间的信息。
借助这一新进展,研究人员将所有可用的实验信息与深度机器学习方法相结合,从而可以完成所有分子的所有活动概况,从化学到临床水平。
“新工具还使我们能够预测新分子的生物活性空间,这在药物发现过程中至关重要,因为我们可以选择最合适的候选物并丢弃那些由于某种原因而不起作用的候选物,”解释说阿洛伊博士。
该软件库可供科学界在 bioactivitysignatures.org 上免费访问,随着更多生物活性数据的可用,研究人员将定期更新该软件库。随着 Chemical Checker 中实验数据的每次更新,人工神经网络也将被修改以完善估计。
预测和可靠性
模型预测的生物活性数据具有或多或少的可靠性取决于各种因素,包括可用的实验数据量和分子的特性。
除了在生物水平上预测活动的各个方面之外,Aloy 博士团队开发的系统还提供了对每个分子预测的可靠性程度的衡量标准。“所有模型都是错误的,但有些模型是有用的!置信度的测量使我们能够更好地解释结果并突出分子的哪些生物活性空间是准确的,哪些空间可以考虑错误率,”Martino Bertoni 博士解释说,该作品的第一作者。
标签: 生物活性
免责声明:本文由用户上传,如有侵权请联系删除!