物候的意思解释(物候的意思) 新手如何开烘焙店?(新手如何开烘焙店赚钱) 巧克力用英语怎么说(巧克力用英语怎么说读音) 淘宝颜色分类怎么设置成图片(淘宝颜色分类怎么设置) 找不到d3d8.dll d3d8thk.dll丢失 解决方案(d3dx9_27.dll丢失怎么办) 过敏性鼻炎怎么治 过敏性鼻炎治疗方法分享(你搜索一下过敏性鼻炎该怎么治疗) bmi指数计算器(bmi指数) 9款圆脸女生适合的甜美长卷发发型(9款圆脸女生适合的甜美长卷发发型是什么) 测排卵期怎么测(测排卵期) 进口奶粉哪个好 教你选购进口奶粉(进口奶粉和进口牛奶哪个好) 组织机构怎么写模板(组织机构怎么写) 怎么换微信主题皮肤(怎么换微信主题皮肤华为) 安装GHOST系统后 IE主页被锁修改不了怎么办 李瑞东太极十三桩(李瑞东) 花字拼音怎么拼写(花字拼音怎么拼写视频) S8韩服高胜率虚空先知玛尔扎哈上单符文天赋出装(新版本玛尔扎哈出装) 后缀是什么意思中文(后缀是什么意思) 土豆怎么放才不发芽(土豆怎么放才不发芽不腐烂呢) 动圈话筒和电容话筒的区别(动圈话筒和电容话筒的区别在哪) 酒店前台常用英语(酒店前台英语常用语) dnf95深渊怎么刷(地下城95怎么刷深渊) 英雄联盟诺提勒斯技能被动介绍(诺提勒斯技能加点) 什么叫中性点接地系统(什么叫中性点) 蛙泳手脚配合慢镜头(蛙泳手脚配合慢动作) 怎样安装电脑xp系统 内眦皮(内眦) 电脑CPU温度过高怎么处理(电脑cpu温度偏高该怎么办) 妇洗器的安装方法(妇洗器使用方法图解) 将视频文件转换为音频文件(jsp文件怎么打开) Win8系统查看已登录的ADSL宽带账号(连接宽带显示windows登录) 放风筝有哪些技巧?(放风筝有哪些技巧视频) dnf装备锻造在哪(dnf装备锻造) 立冬养生小常识(立冬养生小常识发给顾客) 怎样编情侣手机链之女生符号(情侣手链咋编) 中国人民军歌歌词(中国人民解放军军歌歌词) 保山市周边好玩人气旅游景点推荐(保山值得游玩的景点) 哥俩好小游戏怎么两个人玩(哥俩好小游戏在哪玩) 一帆风顺叶子发黄怎么补救(一帆风顺绿植怎么养) csgo国服启动项如何设置(csgo国服启动项怎么设置) psp3000怎么下载游戏(psp3000游戏下载网站) 动漫少女素描教程(动漫少女素描教程视频) cad平面图转为三维立体(cad平面图转为三维图) 免费网络电话(免费网络电话无限打) 科普小报怎么画(四年级科普小报怎么画) 心理学类包括哪些专业 3ds max如何对几何体(物体)进行塌陷操作(3d max 怎么塌陷) 增强免疫力的药有哪些?谨慎科学不盲从!(增强免疫力的药物有) 在qq怎么找到开车群(在qq怎么找到开车群贴吧) 咱们结婚吧——婚礼前六个月准备大全(怀孕6个月办婚礼) 光纤入户名词解释(光纤入户)
您的位置:首页 >资讯 >

MolDiscovery算法帮助科学家找到有前途的小分子

导读 2021年6 月 20 日——一种名为 molDiscovery 的计算机算法使用来自小分子的质谱数据来预测未知物质的身份,这可能会节省研究人员寻找

2021年6 月 20 日——一种名为 molDiscovery 的计算机算法使用来自小分子的质谱数据来预测未知物质的身份,这可能会节省研究人员寻找具有医疗用途的新天然产品的时间和金钱。6 月 17 日,Nature Communications报道了这种新方法。

小分子是低分子量的有机化合物,大小约为 1 nm。确定特定样品中存在或不存在哪些分子以及这些分子是否已知的能力在整个生命科学中具有广泛的应用。

例如,在医学中,医生在患者血液或组织样本中寻找小分子生物标志物以进行疾病诊断和预后,而流行病学家则在人群饮食和环境中寻找小分子以识别疾病风险因素。在药理学中,小分子因其作为治疗药物的潜力而受到关注。

molDiscovery 算法基于预训练的概率模型将小分子与其质谱相匹配,从而提高了小分子识别的效率和准确性。

由于其速度,该算法能够在科学家们的研究早期提醒他们是偶然发现了一个真正独特的分子,还是只是重新发现了已知的东西。

“科学家们浪费了大量时间来分离已知的分子,基本上是重新发现青霉素,”共同作者、卡内基梅隆大学计算机科学学院助理教授 Hosein Mohimani 博士在一份声明中说。“早期检测分子是否已知可以节省时间和数百万美元,并有望使制药公司和研究人员更好地寻找可能导致新药开发的新型天然产品。”

可以由一组质量峰表示的质谱作为小分子的“指纹”或唯一标识符。molDiscovery 算法的工作原理是将从样品中获取的质谱与小分子数据库中的数百万个分子结构进行比较。

molDisocovery 核心的概率模型是根据北美大众银行 (MoNA) 的参考光谱和美国国立卫生研究院 (NIH) 天然产物图书馆的分子光谱对进行训练的。

概率模型采用 P(logRank∣bondType) 形式,其中 logRank 表示相应小分子片段的质量峰强度,bondType 是 SC、OP、PC、CC、NC、OC 或这些的成对组合债券。

为了测试该系统,研究人员在全球天然产物社会分子网络 (GNPS) 存储库中的超过 800 万个光谱上运行了 molDiscovery,这是一个用于共享质谱数据的开放获取知识库。molDiscovery 系统能够以 0% 的错误发现率 (FDR) 识别 3,185 个独特的小分子,与基于化学领域知识的现有方法相比增加了 6 倍。

在具有已知基因组的 GNPS 存储库的一个子集上,molDiscovery 能够正确地将 19 个已知和三个假定的生物合成基因簇与其分子产物联系起来。

作者还指出,与以前的方法相比,molDiscovery 适用于更广泛的分子质量,对于非常小的分子(< 400 Da)表现不佳,并且对于重小分子(> 1000 Da)在计算上变得不足。

molDiscovery 系统可以处理质量高达 2000 Da 的分子,这是 Dereplicator+ 处理质量的两倍,Dereplicator+ 是 Mohimani 实验室开发的早期系统,用于根据化学结构搜索质谱。

标签:

免责声明:本文由用户上传,如有侵权请联系删除!