奈良科学技术研究所的研究人员基于强化学习原理开发了一种新的强迫症模型。该模型可能会导致对强迫症和相关疾病的更好治疗
奈良科学技术研究所 (NAIST)、国际先进电信研究所和多摩川大学的科学家已经证明,强迫症(OCD) 可以理解为强化和惩罚之间学习不平衡的结果。
在对其理论模型的经验测试的基础上,他们表明,将当前结果与过去行为联系起来的大脑计算不对称会导致行为紊乱。具体来说,当过去行为的记忆跟踪信号因好结果和坏结果而衰减不同时,就会发生这种情况。在这种情况下,“好”表示结果比预期好,“坏”表示结果比预期差。这项工作有助于解释强迫症是如何发展的。
强迫症是一种涉及焦虑的精神疾病,其特征是侵入性和重复性的想法,称为强迫症,再加上某些重复的行为,称为强迫症。强迫症患者即使知道强迫观念或强迫行为是不合理的,也常常感到无法改变行为。在严重的情况下,这些可能会使人无法过正常的生活。强迫行为,例如过度洗手或在离开家之前反复检查门是否锁好,是试图暂时缓解强迫症引起的焦虑。然而,迄今为止,人们对强化强迫观念和强迫循环的方式还不是很清楚。
现在,由 NAIST 的研究人员领导的一个团队使用强化学习理论来模拟与强迫症相关的无序循环。在这个框架中,比预期更好的结果变得更有可能(正预测误差),而比预期更差的结果被抑制(负预测误差)。在强化学习的实施中,考虑延迟以及正/负预测误差也很重要。一般来说,某个选择的结果是在一定的延迟之后才可用的。因此,在一定的时间范围内,应该将强化和惩罚分配给最近的选择。这称为信用分配,在强化学习理论中作为记忆轨迹实现。
理想情况下,对于正预测误差和负预测误差,过去动作的记忆跟踪信号以相同的速度衰减。然而,这在离散神经系统中无法完全实现。通过模拟,NAIST 科学家发现,当与负面预测错误(
标签:
免责声明:本文由用户上传,如有侵权请联系删除!