导读 无数的遗传因素会影响高血压,心脏病和2型糖尿病等疾病的发作。如果我们想知道DNA如何影响患上此类疾病的风险,我们可以从反应型护理转向更
无数的遗传因素会影响高血压,心脏病和2型糖尿病等疾病的发作。如果我们想知道DNA如何影响患上此类疾病的风险,我们可以从反应型护理转向更预防性的护理,不仅可以改善患者的生活质量,还可以节省卫生系统的费用。
但是,要追踪DNA与疾病发作之间的系,就需要可靠的统计模型,该模型必须能够可靠地用于数十万患者的大型数据集。
奥地利科学技术研究院(IST)的助理教授Matthew Robinson与一个国际研究人员团队现已开发出一种新的数学模型,该模型可以提高从大量患者基因组数据中获得的预测质量。这种方法可以帮助开发有关健康风险的个性化预测,类似于医师在讨论家庭病史时所做的事情。
数十亿采样
人类DNA由数十亿个碱基对组成,可编码我们的生物学结构和功能。在他们的研究中,科学家选择了数十万个遗传标记-DNA序列的短部分-进行研究。
然后,他们使用统计模型将这些标记物的组成与数据库中患者的高血压,心脏病或2型糖尿病的发作系起来。研究人员对患者发病年龄特别感兴趣。有了这些信息,他们便可以使用其模型预测何时可能发生疾病的概率。
然而,这种统计模型不能建立某些基因与疾病发作之间的直接关系,而只能提供对疾病发作可能性的改进预测。常用的用于大数据研究的黑盒模型与Robinson及其同事的这种方法之间还有一个重要区别:黑盒模型可以产生预测,但是由于许多抽象层,人类无法轻易理解其内部工作原理他们使用。相反,Robinson及其同事的模型提供了可跟踪的统计计算。
标签: 疾病发作
免责声明:本文由用户上传,如有侵权请联系删除!