CAMBRIDGE, MA 在过去的几年里,语言的人工智能模型已经变得非常擅长某些任务。最值得注意的是,它们擅长预测文本字符串中的下一个单词;这项技术可帮助搜索引擎和短信应用程序预测您要输入的下一个单词。
最新一代的预测语言模型似乎也了解了语言的潜在含义。这些模型不仅可以预测接下来出现的单词,还可以执行似乎需要一定程度真正理解的任务,例如问答、文档摘要和故事完成。
此类模型旨在优化预测文本的特定功能的性能,而不会试图模仿人类大脑如何执行此任务或理解语言的任何内容。但麻省理工学院神经科学家的一项新研究表明,这些模型的潜在功能类似于人脑中语言处理中心的功能。
在其他类型的语言任务上表现良好的计算机模型并没有表现出与人脑的这种相似性,这提供了人脑可能使用下一个词预测来驱动语言处理的证据。
“模型在预测下一个单词方面做得越好,它就越接近人类大脑,”麻省理工学院麦戈文大脑研究所和大脑中心成员、认知神经科学沃尔特 A.罗森布利斯教授 Nancy Kanwisher 说, Minds, and Machines (CBMM),以及这项新研究的作者。“令人惊讶的是,这些模型的拟合如此之好,它非常间接地表明,人类语言系统正在做的事情可能正在预测接下来会发生什么。”
Joshua Tenenbaum,麻省理工学院计算认知科学教授,CBMM 和麻省理工学院人工智能实验室(CSAIL)成员;和 Evelina Fedorenko,神经科学领域的 Frederick A. 和 Carole J. Middleton 职业发展副教授以及麦戈文研究所的成员,是该研究的资深作者,该研究本周发表在美国国家科学院院刊上。在 CBMM 工作的麻省理工学院研究生 Martin Schrimpf 是该论文的第一作者。
做出预测
新的、高性能的下一个词预测模型属于一类称为深度神经网络的模型。这些网络包含形成不同强度连接的计算“节点”,以及以规定方式在彼此之间传递信息的层。
在过去的十年里,科学家们使用深度神经网络来创建视觉模型,可以像灵长类动物的大脑一样识别物体。麻省理工学院的研究还表明,视觉对象识别模型的潜在功能与灵长类动物视觉皮层的组织相匹配,即使这些计算机模型并不是专门为模仿大脑而设计的。
标签:
免责声明:本文由用户上传,如有侵权请联系删除!