近年来,科学家们在开发人工智能算法方面取得了长足的进步,这些算法可以分析患者数据并提出诊断疾病或预测哪种治疗对不同患者最有效的新方法。
这些算法的成功取决于对患者健康数据的访问,这些数据已经被剥夺了可用于从数据集中识别个人的个人信息。然而,通过其他方式识别个人身份的可能性引起了隐私权倡导者的关注。
在一项新研究中,由麻省理工学院首席研究科学家 Leo Anthony Celi 领导的一组研究人员量化了这种患者重新识别的潜在风险,并发现目前相对于数据泄露的风险而言,它的风险极低。事实上,在 2016 年至 2021 年期间,也就是研究检查的时期,没有关于通过公开可用的健康数据重新识别患者的报告。
研究结果表明,患者隐私的潜在风险大大超过了患者的收益,他们受益于更好的诊断和治疗,Celi 说。他希望在不久的将来,这些数据集将变得更广泛可用,并包括更多样化的患者群体。
“我们同意患者隐私存在一定风险,但也存在不共享数据的风险,”他说。“不共享数据是有害的,这需要考虑到等式中。”
Celi 也是哈佛 TH Chan 公共卫生学院的讲师和贝丝以色列女执事医疗中心肺科、重症监护和睡眠医学部的主治医师,他是这项新研究的资深作者。贝丝以色列女执事医疗中心的胸外科研究员 Kenneth Seastedt 是这篇论文的主要作者,该论文今天发表在PLOS Digital Health 上。
风险收益分析
由医院和其他机构创建的大型健康记录数据库包含有关心脏病、癌症、黄斑和 等疾病的大量信息,研究人员利用这些信息试图发现诊断和治疗疾病的新方法。
麻省理工学院计算生理学实验室的 Celi 和其他人创建了几个公开可用的数据库,包括重症监护医学信息集市 (MIMIC),他们最近使用这些数据库开发了可以帮助医生做出更好医疗决策的算法。许多其他研究小组也使用了这些数据,其他研究小组也在世界各国创建了类似的数据库。
通常,当将患者数据输入此类数据库时,会删除某些类型的识别信息,包括患者姓名、地址和电话号码。这是为了防止患者被重新识别,并防止他们的医疗状况信息被公开。
标签:
免责声明:本文由用户上传,如有侵权请联系删除!