霁彩华年,因梦同行—— 庆祝深圳霁因生物医药转化研究院成立十周年 情绪益生菌PS128助力孤独症治疗,权威研究显示可显著改善孤独症症状 PARP抑制剂氟唑帕利助力患者从维持治疗中获益,改写晚期卵巢癌治疗格局 新东方智慧教育发布“东方创科人工智能开发板2.0” 精准血型 守护生命 肠道超声可用于检测儿童炎症性肠病 迷走神经刺激对抑郁症有积极治疗作用 探索梅尼埃病中 MRI 描述符的性能和最佳组合 自闭症患者中痴呆症的患病率增加 超声波 3D 打印辅助神经源性膀胱的骶神经调节 胃食管反流病患者耳鸣风险增加 间质性膀胱炎和膀胱疼痛综合征的临床表现不同 研究表明 多语言能力可提高自闭症儿童的认知能力 科学家揭示人类与小鼠在主要癌症免疫治疗靶点上的惊人差异 利用正确的成像标准改善对脑癌结果的预测 地中海饮食通过肠道细菌变化改善记忆力 让你在 2025 年更健康的 7 种惊人方法 为什么有些人的头发和指甲比其他人长得快 物质的使用会改变大脑的结构吗 饮酒如何影响你的健康 20个月,3大平台,300倍!元育生物以全左旋虾青素引领合成生物新纪元 从技术困局到创新锚点,天与带来了一场属于养老的“情绪共振” “华润系”大动作落槌!昆药集团完成收购华润圣火 十七载“冬至滋补节”,东阿阿胶将品牌营销推向新高峰 150个国家承认巴勒斯坦国意味着什么 中国海警对非法闯仁爱礁海域菲船只采取管制措施 国家四级救灾应急响应启动 涉及福建、广东 女生查分查出608分后,上演取得理想成绩“三件套” 多吃红色的樱桃能补铁、补血? 中国代表三次回击美方攻击指责 探索精神健康前沿|情绪益生菌PS128闪耀宁波医学盛会,彰显科研实力 圣美生物:以科技之光,引领肺癌早筛早诊新时代 神经干细胞移植有望治疗慢性脊髓损伤 一种简单的血浆生物标志物可以预测患有肥胖症青少年的肝纤维化 婴儿的心跳可能是他们说出第一句话的关键 研究发现基因检测正成为主流 血液测试显示心脏存在排斥风险 无需提供组织样本 假体材料有助于减少静脉导管感染 研究发现团队运动对孩子的大脑有很大帮助 研究人员开发出诊断 治疗心肌炎的决策途径 两项研究评估了医疗保健领域人工智能工具的发展 利用女子篮球队探索足部生物力学 抑制前列腺癌细胞:雄激素受体可以改变前列腺的正常生长 肽抗原上的反应性半胱氨酸可能开启新的癌症免疫治疗可能性 研究人员发现新基因疗法可以缓解慢性疼痛 研究人员揭示 tisa-cel 疗法治疗复发或难治性 B 细胞淋巴瘤的风险 适量饮酒可降低高危人群罹患严重心血管疾病的风险 STIF科创节揭晓奖项,新东方智慧教育荣膺双料殊荣 中科美菱发布2025年产品战略布局!技术方向支撑产品生态纵深! 从雪域高原到用户口碑 —— 复方塞隆胶囊的品质之旅
您的位置:首页 >要闻 >

科学家开发了一种用于人脸识别的计算机模型

当我们睁开眼睛时,我们会立即看到周围的环境。大脑如何如此快速地形成这些丰富而详细的世界表征,是视觉研究中最大的未解之谜之一。

研究大脑的科学家试图通过使用计算机视觉模型来复制这种现象,但迄今为止,领先的模型只执行更简单的任务,例如在杂乱的背景中拾取物体或人脸。现在,由麻省理工学院认知科学家领导的团队开发了一个计算机模型,该模型捕捉了人类视觉系统从图像中快速生成详细场景描述的能力,并提供了一些关于大脑如何实现这一功能的见解。

乔希说:“我们在这项工作中试图做的是解释感知比仅仅给图像的所有部分贴上语义标签要丰富得多,并探索如何看待整个物理世界。”特南鲍姆是计算认知科学教授,也是计算机科学和人工智能实验室(CSAIL)和麻省理工学院大脑、思维和机器中心(CBMM)的成员。

新模型假设,当大脑接收到视觉输入时,它将快速执行一系列计算,从而逆转了计算机图形程序用来生成人脸或其他对象的2D表示的步骤。研究人员表示,这种被称为有效逆图(EIG)的模型,与非人类灵长类大脑面部选定区域的电记录也有很好的相关性,这表明灵长类视觉系统的组织方式几乎与计算机模型相同。

这篇论文的主要作者是前麻省理工学院博士后伊尔克耶尔德勒姆(Ilker Yildirim),他现在是耶鲁大学的心理学助理教授。论文今天发表在《科学进展》。洛克菲勒大学的神经科学和行为学教授特南鲍姆和温里奇弗赖瓦尔德是这项研究的资深作者。耶鲁大学研究生马里奥贝勒东也是一名作家。

反向图形

几十年来,对大脑视觉系统的研究已经非常详细地研究了如何将入射到视网膜上的光转换成内聚场景。这种理解有助于人工智能研究人员开发能够复制系统所有方面的计算机模型,例如识别人脸或其他物体。

特南鲍姆说:“视觉是我们对人类和其他动物最了解的大脑功能方面。”“目前,计算机视觉是AI最成功的领域之一。我们相信,机器现在可以很好地观察图片,很好地识别人脸,并检测其他种类的物体。”

然而,即使是这些复杂的人工智能系统也无法与人类视觉系统实现的功能相比。

他说:“我们的大脑不仅会检测那里的物体,而且不会识别和标记它们。”“我们看到了所有的形状、几何形状、表面和纹理。我们看到了一个非常富裕的世界。”

一个多世纪前,医生、物理学家和哲学家赫尔曼赫尔姆霍茨提出了这样一个理论,即大脑通过逆转图像形成过程来创造这些丰富的表征。他假设视觉系统包括一个图像生成器,例如,它将用于生成我们在梦中看到的面孔。研究人员说,反向运行发电机将使大脑从图像向后移动,并推断哪种脸或其他物体会产生图像。

然而,问题仍然存在:大脑如何如此快速地执行这个过程(称为逆图形)?科学家们试图创造一种能够执行这一任务的算法,但在过去,最好的系统需要许多循环的迭代处理,这比大脑创建你所看到的详细视觉表示所需的100到200毫秒要长得多。神经科学家认为,大脑的感知之所以能够如此迅速地进行,是因为它是通过前馈传递和神经处理的几个层级组织层来实现的。

麻省理工学院领导的团队着手构建一个特殊的深度神经网络模型,展示神经层次如何快速推断场景的基本特征——在这种情况下,是特定的人脸。与计算机视觉中使用的标准深度神经网络相反,后者是从表示图像中对象类别的标记数据中训练的,而研究人员的网络是通过反映大脑中能够表达面部表情的场景的内部表示的模型来训练的。看起来。

因此,他们的模型学会了逆转由计算机图形程序执行的生成人脸的步骤。这些图形程序从单个面部的三维表示开始,然后将其转换为二维图像(从特定的视点)。这些图像可以放在任何背景图像上。研究人员认为,当你做梦或联想到某人面部的心理图像时,大脑的视觉系统可能会执行类似的操作。

研究人员训练他们的深层神经网络以相反的方式执行这些步骤——也就是说,它从2D图像开始,然后添加纹理、曲率和光照等功能,以创建研究人员所说的“2.5D”。这些2.5D图像从特定角度指定面部的形状和颜色。然后将它们转换为独立于视点的3D表示。

标签:

免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!