渴求与决策的因果纠缠：一项连接酒精与可卡因成瘾风险个体瞬时渴求与强化学习的计算机制研究

时间：2026年3月27日

来源：Nature Mental Health

编辑推荐：

成瘾行为中，渴求与适应不良决策紧密交织，但其交互作用的计算机制尚不明确。为探索瞬时渴求与决策如何相互影响，本文研究人员采用计算建模方法，考察了具有中高成瘾风险水平的酒精饮用者和可卡因使用者在决策任务中的行为。研究发现，在成瘾线索情境下，瞬时渴求以相反方向偏倚了酒精和可卡因成瘾者的学习率（α），而在金钱情境下则偏倚了结果感知。同时，期望值（EV）和结果共同驱动了诱发的渴求。模型衍生的计算参数在预测酒精成瘾风险上显示出额外效用。该研究揭示了一个连接渴求与决策的计算框架，并提示了针对特定物质的干预需求。

成瘾的恶性循环：渴求如何扭曲你的选择？

你是否曾对某些事物产生过强烈的渴望，以至于明知不该，却仍无法控制地去追求？在物质成瘾领域，这种强烈的、主观的欲望被称为“渴求”，它与人们做出的、往往导致不良后果的“决策”行为紧密相连。尽管科学界普遍认为，渴求和适应不良的决策是所有类型成瘾的核心，但这两个研究领域长期以来却相对独立，一个能够解释它们如何动态、实时地相互影响的、清晰的“计算机制”模型一直缺失。传统上，基于“线索反应”的经典研究揭示了渴求可以被与药物相关的线索所激发，但这并不能解释渴求本身如何产生，又如何反过来影响人们对药物线索的反应和选择。比如，戒断期间线索的移除有时反而会增加渴求和寻药行为，这种现象被称为“渴求的孵化”。此外，对药物的信念和期望也会影响渴求，这种效应独立于药物奖励和线索的存在。这表明，尽管关于渴求的实证研究很丰富，但其计算机制仍是个谜。

在决策方面，强化学习（Reinforcement Learning, RL）是解释成瘾者为何做出适应不良选择的主要框架，其核心在于“奖赏预测误差”信号不断强化药物相关选择。然而，这些理论大多在动物模型中得到验证，在人类成瘾者中的实证检验有限，且它们仍未解释药物相关选择和渴求如何相互影响。近年来，计算精神病学领域开始探索基于价值的决策与情绪等主观状态之间的相互作用，为理解渴求与决策的互动提供了新思路，但一个能够清晰连接这两种心理过程的计算模型仍然缺席。

为了解决这一关键问题，研究人员在《自然-心理健康》杂志上发表了一项研究，旨在检验一个核心假设：在成瘾个体中，瞬时的药物渴求和基于价值的决策会以双向、动态的方式相互塑造。为此，他们设计了一个精巧的实验范式，并运用了先进的计算建模方法。

研究是如何展开的？

研究人员招募了132名具有中度至高成瘾风险的参与者，分为酒精饮用者组和可卡因使用者组。他们让这些参与者在线上玩一个修改版的“双臂老虎机”任务。在任务中，参与者需要选择两台机器中的一台，以赢取奖励。奖励分为两种情境：一种是金钱（图片为硬币），另一种是成瘾线索（参与者预先选择的、最具诱惑力的酒精或可卡因图片）。在整个任务过程中，参与者会被间歇性地要求实时报告他们对酒精或可卡因的瞬时渴求水平。通过将参与者的选择行为、获得的结果以及报告的渴求数据输入计算模型，研究人员得以深入剖析渴求如何影响学习过程，以及决策过程中的价值信号又如何反过来影响渴求的产生。

渴求如何偏倚决策？

•
模型比较揭示最佳解释：研究人员比较了多个候选模型来解释参与者的选择行为。在成瘾线索条件下，一个名为“学习率偏倚模型”的模型为两组参与者的行为提供了最佳拟合。在该模型中，瞬时渴求水平会动态地调整个体从药物相关线索的奖赏或未获得奖赏（即“奖赏预测误差”）中学习的快慢速度，这个调整的程度由一个调制参数φ来量化。
•
作用方向截然相反：深入分析模型参数后，一个惊人的发现浮出水面。调制参数φ的值在两组之间呈现显著差异。对于酒精饮用者，φ值为正，意味着更高的渴求加速了与酒精相关的学习，使他们对酒精线索的奖赏预测误差更加敏感。相反，对于可卡因使用者，φ值为负，意味着更高的渴求减缓了与可卡因相关的学习，降低了对可卡因线索奖赏预测误差的敏感性。
•
情境与物质特异性：在金钱条件下，最佳模型是“结果偏倚模型”，即渴求主要影响了对金钱结果价值的感知，而非学习率。此外，在“交叉”控制实验中（如可卡因使用者面对酒精线索），以及在健康对照组中，渴求对决策的偏倚效应均未出现。这表明，渴求对学习的偏倚效应是物质特异性的，只针对使用者主要的成瘾物质线索。

决策如何驱动渴求？

•
期望与结果共同作用：研究人员也构建了模型来解释决策变量如何驱动瞬时的渴求报告。模型比较发现，无论在成瘾线索还是金钱条件下，期望值和实际结果的组合模型最能解释渴求的波动。这说明，渴求的产生不仅受到眼前药物线索（结果）的直接影响，也受到个体对获得该线索的预期的影响。
•
参数存在组间差异：在成瘾线索条件下，酒精饮用者的渴求更显著地受到“结果”权重的影响，而可卡因使用者的参数则未达到显著性水平。在金钱条件下，可卡因使用者的渴求受“结果”影响更显著，而酒精饮用者的渴求则显示出受“期望值”的负面影响。这再次揭示了两组人群在渴求产生机制上的细微差别。

计算参数的临床预测价值

为了评估这些计算模型参数是否具有临床意义，研究人员进行了一系列回归分析，试图预测参与者的成瘾风险评分。结果发现，结合了人口统计学信息、计算模型参数和模型无关的任务表现指标的完整模型，在预测酒精饮用者的成瘾风险时表现最佳。具体来说，更高的基线学习率、更高的基线渴求和更高的结果权重与更高的酒精成瘾风险相关。然而，在预测可卡因使用者的成瘾风险时，仅包含人口统计学信息的模型表现最好，计算参数并未提供额外的预测价值。这提示计算模型参数在临床应用中的价值可能依赖于具体的成瘾物质。

结论与深远意义

本研究首次构建了一个完整的计算框架，用以解释酒精和可卡因成瘾风险个体中瞬时渴求与决策之间的双向、动态联系。核心结论如下：

1.
共享机制与物质特异性：酒精和可卡因使用者共享一个相同的计算算法，即瞬时渴求会特异性地偏倚其对主要成瘾物质线索的学习过程，而对非成瘾性（金钱）线索则偏倚结果感知。然而，这种偏倚的作用方向在两种物质间是相反的：酒精渴求加速学习，可卡因渴求减缓学习。这提示两种物质的成瘾机制在计算层面存在深刻差异。
2.
渴求的双重驱动：瞬时渴求受到个体对获得药物的期望和实际接触到的药物线索的共同驱动。这为经典的“线索诱发渴求”现象提供了更精细的计算解释，将先验信念（期望）和后验证据（结果）整合到统一的框架中。
3.
潜在的临床应用：本研究表明，通过计算建模揭示的、描述渴求-决策交互作用的潜变量，能够提供超越简单人口学或任务表现指标的信息，尤其是在预测酒精成瘾风险方面。这为开发基于计算精神病学评估的、个体化的成瘾风险预测工具和干预靶点提供了新的可能性。

这项研究的意义在于，它将渴求和决策这两个长期被分开研究的成瘾核心要素，置于一个统一的、可量化的计算框架下进行考察。它揭示了成瘾行为背后可能存在的恶性循环：渴求扭曲学习，导致适应不良的决策，而这些决策的结果又反过来强化或催生新的渴求。更重要的是，它指出了酒精和可卡因成瘾可能有着截然不同的计算“指纹”，这强烈暗示了未来开发针对特定物质的、精准干预措施的必要性，而非采用“一刀切”的治疗方案。通过理解和量化这个循环，临床医生和研究人员或许能找到新的突破口，通过干预渴求或纠正被扭曲的学习过程，来打破成瘾的链条，为成瘾治疗带来新的希望。

引领行业 | 聚焦麦特绘谱代谢组学整体解决方案>>

揭秘单细胞测序-深入了解这项正在改变我们开展科学研究的技术>>

对同一细胞中的转录组和表观基因组进行同时分析（使用细胞核分离试剂盒简化样本制备工作流程）>>

「大小鼠繁育与健康管理」指导海报，点击即可免费领取电子版或实体海报>>

热点排行

生物通微信公众号

在线客服

微信

新浪微博

我要投稿

返回顶部