机器学习模型有助于解释大脑如何识别交流声音的含义,例如动物叫声或口语。研究中描述的算法模拟了社会性动物(包括狨猴和豚鼠)如何使用大脑中的声音处理网络来区分声音类别(例如求偶、食物或危险的呼唤)并对其采取行动。
这项研究是理解声音识别背后的神经元处理的复杂性的重要一步。这项工作的见解为理解并最终治疗影响语音识别的疾病和改善助听器铺平了道路。
这项工作发表在《通讯生物学》的论文中,“自适应机制促进听觉分类模型中噪声和混响的鲁棒性能。”
“我们认识的每个人或多或少都会在生命中的某个时刻失去部分听力,要么是由于衰老,要么是暴露在噪音中。了解声音识别的生物学原理并找到改进方法非常重要。”匹兹堡大学神经生物学助理教授SrivatsunSadagopan博士说。“但是声音交流的过程本身就很有趣。我们的大脑相互交互、接受想法并通过声音传达它们的方式简直就是神奇。”
该团队的直觉是,人脑识别和捕捉交流声音含义的方式可能类似于识别面部和其他物体的方式。面孔高度多样化,但也有一些共同特征。
我们的大脑不会将我们遇到的每张脸与某个完美的“模板”脸进行匹配,而是会拾取有用的特征,例如眼睛、鼻子和嘴巴以及它们的相对位置,并创建这些小特征的心理地图,这些特征定义了一张脸。
在一系列研究中,研究小组表明,交流声音也可能是由这样的小特征组成的。研究人员首先建立了声音处理的机器学习模型,以识别社会性动物发出的不同声音。为了测试大脑反应是否与模型相符,他们记录了豚鼠听其亲属的交流声音时的大脑活动。当大脑中负责处理声音的神经元听到具有特定类型声音特征的噪音时,它们会发出一阵电活动,类似于机器学习模型。
然后他们想根据动物的现实行为来检查模型的性能。豚鼠接触到不同类别的声音——吱吱声和咕噜声被归类为不同的声音信号。研究人员训练豚鼠走到围栏的不同角落,并根据播放的声音类别获得水果奖励。
然后,他们让任务变得更加困难:为了模仿人类识别不同口音的人所说的单词含义的方式,研究人员通过声音改变软件运行豚鼠的叫声,加快或减慢它们的速度,提高或降低它们的音调,或添加噪音和回声。
这些动物不仅能够始终如一地执行任务,就好像它们听到的叫声没有改变一样,而且尽管有人工回声或噪音,它们仍然表现良好。更好的是,机器学习模型描述了他们的行为(以及大脑中声音处理神经元的潜在激活)。
下一步,研究人员正在将该模型的动物语言准确性转化为人类语言。
“从工程角度来看,有更好的语音识别模型。我们的模型的独特之处在于,我们与行为和大脑活动有密切的对应关系,这让我们对生物学有更深入的了解。”皮特大学神经生物学系博士后萨蒂亚布拉塔·帕里达(SatyabrataParida)博士说。“将来,这些见解可用于帮助患有神经发育疾病的人或帮助设计更好的助听器。”
标签:
免责声明:本文由用户上传,如有侵权请联系删除!