现代预测模型需要大量数据进行训练和评估,缺乏这些数据可能会导致模型针对特定地点、人口和那里的临床实践。目前,临床风险预测模型的最佳实践缺乏一定程度的“普遍性”,这可能会极大地增加它们对其他地点的其他临床环境的有用性。
由纽约大学全球公共卫生学院计算机科学与工程教授 Rumi Chunara 领导的纽约大学 Tandon 研究小组调查了死亡率预测模型在应用于与其开发所在不同的医院或地区时是否存在显着差异.他们还查询数据以确定数据集的具体特征——包括分析 2014 年至 2015 年美国 179 家医院的电子健康记录,其中 70,126 人住院——这可以解释基于种族等因素的临床表现差异。
在PLOS Digital Health的一篇新论文中,研究人员,包括博士 Harvineet Singh。纽约大学数据科学中心的学生和博士 Vishwali Mhasawade。在 Chunara 的指导下,候选人发现,包括在一家医院或地理区域开发的临床(生命体征、实验室和手术)变量的死亡风险预测模型缺乏对不同医院或地区的普遍适用性。基于因果发现分析,他们假设这种缺乏普遍性的原因是数据集在不同医院或地区的种族和临床变量的变化。简而言之,种族变量与临床变量密切相关。
“从这项研究中可以清楚地看出,数据模型——就医院到医院和区域医院集团层面的死亡率风险预测等因素而言——不能立即推广,这对无法为自己生成这些模型的医院产生影响”春娜拉说。
研究结果还表明,即使在平均人口范围指标方面表现良好,预测模型也可能表现出跨种族的表现差异。
“虽然有充分证据表明临床因素和结果可能因种族而有显着差异,但我们了解为什么存在这些差异至关重要,因此必须在更大的背景下检查数据和模型,同时考虑来自地理和社会经济的各种影响。临床,”她说。
具体而言,该研究表明,除了算法公平性指标之外,还需要了解子组的数据生成过程,以识别和减轻变异来源,并决定是否在新环境中使用风险预测模型。
标签:
免责声明:本文由用户上传,如有侵权请联系删除!