《Nature》大脑如何权衡风险与回报?哈佛研究揭示“下注”决策背后的神经机制

时间:2025年2月21日
来源:Nature

编辑推荐:

每天,我们的大脑都会做出数千个大大小小的决定。这些决定中的任何一个——从最不重要的决定,比如选择一家餐馆,到更重要的决定,比如追求不同的职业或搬到一个新城市——都可能导致更好或更坏的结果。

广告
   X   

科学家们在小鼠身上发现了两组脑细胞:一组帮助小鼠了解高于平均水平的结果,另一组与低于平均水平的结果有关。实验表明,这些细胞一起使大脑能够衡量与选择相关的所有可能奖励。

“我们的研究结果表明,小鼠——以及其他哺乳动物——似乎比我们以前认为的更能代表风险和回报的细节。”哈佛医学院Blavatnik研究所神经生物学副教授、共同资深作者Jan Drugowitsch表示。

如果在人类身上得到证实,这些发现可以为理解人类大脑如何做出基于奖励的决定,以及当奖励回路失效时,判断风险和奖励的能力会发生什么变化提供一个框架。

机器学习阐明基于奖励的决策

长期以来,神经科学家一直对大脑如何利用过去的经验做出新的决定感兴趣。然而,根据Drugowitsch的说法,许多关于此类决策的传统理论未能捕捉到现实世界行为的复杂性和细微差别。

Drugowitsch以选择餐厅为例:如果你想要谨慎行事,你可能会选择一家菜单确实不错的餐厅,如果你想要冒险,你可能会选择一家你知道提供优质和劣质菜肴的餐厅。

在上述例子中,餐馆提供的食物种类差别很大,但现有的神经科学理论认为它们在平均时是相等的,因此预测选择其中任何一个的可能性是相等的。

“我们知道这不是人类和动物的行为方式——我们可以在冒险和安全之间做出决定。”Drugowitsch说,“与我们的选择相关的不仅仅是平均预期回报。”

近年来,机器学习研究人员开发了一种决策理论,可以更好地捕捉与选择相关的所有潜在回报。他们将这一理论整合到一种新的机器学习算法中,该算法在雅达利电子游戏和一系列其他任务中的表现优于其他算法,其中每个决策都有多种可能的结果。

“他们基本上是在问,如果算法不是只学习特定行为的平均奖励,而是学习整个分布,会发生什么,他们发现这大大提高了表现。”Drugowitsch说。

在2020年发表于《Nature》杂志的一篇论文中,哈佛大学分子和细胞生物学教授Naoshige Uchida及其同事重新分析了现有数据,以探索这种机器学习理论是否适用于神经科学,特别是在啮齿动物大脑决策的背景下。分析表明,在小鼠身上,神经递质多巴胺的活动——它在寻求奖励、快乐和动机中起作用——与算法预测的奖励学习信号相对应。

换句话说,Drugowitsch表示,这项工作表明新的算法在解释多巴胺活动方面做得更好。

小鼠的大脑如何表现一系列奖励

在这项新研究中,Drugowitsch与共同资深作者Uchida合作,将研究进一步推进。他们一起设计了小鼠实验,来观察这个过程是如何在一个叫做腹侧纹状体的大脑区域中进行的,这个区域存储着与决策相关的可能奖励的信息。

“多巴胺活动只提供预期奖励的学习信号,但我们想直接在大脑中找到这些学习奖励的表征。”Drugowitsch说。

研究人员训练小鼠将不同的气味与不同程度的奖励联系起来——本质上,教会老鼠选择的可能结果的范围。然后,他们给小鼠提供气味,观察它们的舔舐行为(小鼠在期待更好的奖励时舔得更多),同时记录腹侧纹状体的神经活动。

研究小组在大脑中发现了两组不同的神经元:一组帮助小鼠了解好于预期的结果,另一组与坏于预期的结果有关。

“你可以把它想象成你的大脑里有一个乐观主义者和一个悲观主义者,它们都会给你下一步该做什么提供建议。”Drugowitsch解释说。

当研究人员使“乐观”神经元沉默时,小鼠表现出的行为表明,它预期的奖励不那么吸引人。相反,当研究人员使“悲观”神经元沉默时,小鼠表现得好像期待更高的待遇。

“这两组脑细胞一起工作,形成了一个决定潜在奖励的完整分布。”Drugowitsch说。

研究人员看到了他们工作的许多未来方向,包括当每个初始选择所代表的不确定性增加时,大脑如何做出决定,以及他们的发现如何应用于对世界的更一般的推理。

Drugowitsch指出,需要更多的研究来证实人类的结果,并使这些发现适应人类决策的复杂性。然而,基于小鼠和人类大脑之间的相似之处,他相信这项工作可能已经揭示了人类如何评估决策中的风险,以及为什么患有抑郁症或成瘾等特定疾病的人可能难以进行此类评估。

相关新闻
生物通微信公众号
微信
新浪微博


生物通 版权所有