直接面向消费者的基因检测使数以百万计的人能够确定他们的血统并深入了解他们对遗传疾病的遗传倾向。虽然个人基因分型信息是安全存储的,但有些人同意共享他们的基因组数据以供进一步研究。
这种数据共享引起了对基因组隐私的一些合理担忧。例如,黑客是否可以根据从开源网络平台合法下载的基因型数据重新识别一个人——也许构建一张他们的脸的照片?
2017 年,基于基因组学的健康情报公司 Human Longevity 和其他研究小组报告说,根据 DNA 预测一个人的面部外观是可行的。
对这项工作的隐私风险影响很感兴趣,圣路易斯华盛顿大学的教职员工 Yevgeniy “Eugene” Vorobeychik 是应用博弈论确定数据共享设置中的隐私风险的专家,他进行了自己的研究。
“我们想看看这些结果能在多大程度上推广到现实世界,”麦凯维工程学院计算机科学与工程副教授 Vorobeychik 说。“我们探讨了是否有可能在更实际的情况下证明这些担忧是真实的。”
Vorobeychik 和他的合著者——华盛顿大学研究生 Rajagopal Venkatesaramani 和范德比尔特大学生物医学信息学教授 Bradley Malin——发现将人脸和基因组联系起来的任务平均比之前报道的要困难得多。他们于2021 年 11 月 17 日在《科学进展》上发表了他们的发现。
在这项研究中,他们开发了一种方法,通过将这些与公开发布的面部图像相关联,从 OpenSNP 基因组共享平台获得的 126 个基因组精心策划的数据集中计算重新识别个体的风险。具体来说,他们使用神经网络模型来预测可见的身体特征,例如头发、眼睛和肤色以及性别,然后使用这些信息以及已知的基因型-特征相关性来对可能的基因组-面部匹配进行评分。
早期的表型关联研究使用在具有专业质量照明的实验室环境中拍摄的高质量照片。另一方面,Vorobeychik 的团队使用社交媒体网站上的真实照片进行了研究。
“我们所做的是为这些不同类型的视觉特征构建概率模型,并通过对特定基因组和特定面孔之间的匹配质量进行评分来基本上连接点,”Vorobeychik 解释说。“然后我们使用该评分系统来预测哪些比赛最有可能。”
总体而言,他们的结果表明,有时可以将公共面部图像与公共基因组数据联系起来,但成功率远低于先前研究论文在理想化环境中所建议的。
标签:
免责声明:本文由用户上传,如有侵权请联系删除!